Collecting Robot Training Data is Dirty Work, and AI Labs are Paying XDOF to Do It
生成AIのブームは、膨大なデータ—インターネットからスクレイピングされた数兆語のテキスト—によって支えられてきた。それにより、大規模言語モデル(LLM)は文章を書き、コードを書き、会話する方法を学んできた。しかし、テクノロジー業界の関心が「フィジカルAI」—現実世界を移動し対話するように設計されたロボット—へと移るにつれ、巨大なデータのボトルネックに直面している。フィジカルAIがLLMの成果に匹敵するには、このデータ問題を早急に解決する必要がある。
テキストベースのAIとは異なり、ロボットは単にインターネットから訓練データをスクレイピングすることはできない。それらには、現実世界から収集された物理的、空間的、感覚的なデータが必要だ。つまり、人間がモーキャプグローブを着用したり、遠隔操作装置を使ったりしながら、ドアを開ける、壊れやすい物を拾う、洗濯物をたたむ、散らかった部屋を移動するといったタスクを手動で実行しなければならないということだ。これは汚く、反復的で、地味な仕事だ。それでも、ロボットアームやヒューマノイドの胴体に流れるような正確な動きを教えるための基礎的な燃料となるのだ。
必要なデータの膨大な規模を認識し、トップクラスのAI研究機関の中には、この過酷な労働をアウトソーシングし始めるところもある。TechCrunchの最近の報道によると、XDOFはこの地味なニッチ分野で主要なプレーヤーとして台頭しており、大手AI研究機関はすでに同社に物理データ収集という重労働を委託して支払いを行っている。XDOFのような専門企業に頼ることで、AI開発者は何千時間もの人間のモーションキャプチャを調整するという骨の折れる作業ではなく、アルゴリズムのブレイクスルーに集中できる。
XDOFのような企業の台頭は、フィジカルAIのエコシステムが成熟しつつあることを示している。LLMのゴールドラッシュにおいてデータラベリング企業が不可欠な存在になったのと同じように、物理データ収集スタートアップはロボット革命における重要な「ツルハシ役」(インフラを提供するビジネス)になりつつある。この仕事には、複雑な模擬環境の構築、反復的な物理タスクを行う作業員の採用、そしてニューラルネットワークに読み込めるように収集したセンサーデータをクリーンアップすることが含まれる。
汎用ロボットの開発競争が加速するにつれ、高品質な現実世界の物理データへの需要はさらに激化するだけだ。人工知能の次なる飛躍は、斬新なアルゴリズムから生まれるのではなく、機械に動き方を教えるためにその動きが綿密に記録された人間の、退屈な肉体労働から生まれるかもしれない。フィジカルAIの時代においても、データは依然として王様だ—ただし、それを収集するには自分の手を汚さなければならない。