フォームが先、データは後:物理AIの真のボトルネック
物理AIのボトルネックは知能ではなく、現実世界のデータを収集するための適切な物理的形態と感覚である。テスラが自動運転で成功したのは、自動車がすでに適切な形を持っていたからだ。人型ロボットには触覚センシングとタスク固有のデータが不足している。現在成功している物理AIアプリケーションは人間型ではなく、農業用視覚ベースのアームなど単純な形態と高度な視覚の組み合わせである。
先週、読者から物理世界におけるAIの進展について質問を受けました。私の見解では、モデルと基盤技術は既に十分であるが、適切な「身体」と「感覚」、そして現実世界をナビゲートするためのデータが不足しています。テスラが自動運転で最初に成功したのは、モデルが最も賢かったからではなく、自動車がタスクに適した形態だったからです。車は二次元で動き、四つの接点を持ち、転倒しません。この形態がデータ収集のフライホイールを可能にし、現在ではFSDで100億マイル以上の走行データを蓄積しています。
人型ロボットの課題はより複雑です。歩行やバランスは解決されつつありますが、触覚とタスク固有のデータが決定的に不足しています。例えば、シャツを折るには視覚だけでなく、布が滑り始めたときに握力を調整する触覚が必要ですが、そのようなセンサーは高価で未成熟です。シミュレーションは「シム・トゥ・リアル」のギャップに直面しており、わずかな誤差が大きな失敗につながります。
現在の展開例は限定的です。FigureはBMW工場でパーツ配置に使用され、テスラは工場内でOptimusを5万台稼働させる目標を掲げています。UnitreeのG1は約1万6000ドルで販売されています。しかし、これらのタスクはすべて単一目的であり、監督下で行われます。真の進展は農業分野で見られます。果実摘み用アームはYOLOベースの熟度検出器とディープラーニング視覚スタックを使用し、複雑な環境でも動作します。ジョン・ディアの自動運転トラクターは16カメラと認識モデルを搭載し、農場での自律作業を実現しています。
重要なのは、物理AIの成功は知能の向上ではなく、適切な形態とデータ収集の仕組みにかかっているということです。人型ロボットは汎用性を約束しますが、その前に触覚と大規模な実世界データの課題を克服する必要があります。