COBALT: スマートフォンを使ったクラウドベース遠隔操作によるロボット学習のクラウドソーシング
COBALTは、スマートフォンなどの一般的なデバイスを使用して、ロボット模倣学習のための高品質なデモンストレーションデータをクラウドソーシングで収集できる新しい遠隔操作プラットフォームです。同時マルチユーザ制御をサポートし、遠隔操作コストを削減し、低遅延を実現します。9カ国でのパイロットデータセットは、スマートフォンベースの遠隔操作が専用ハードウェアと同等以上であることを示しました。
COBALT は、ロボット模倣学習における大規模で高品質なデモンストレーションデータの不足という課題に取り組む画期的なプラットフォームです。このシステムは、クラウドベースの遠隔操作を活用し、スマートフォンなどの一般的なデバイスを使って世界中のどこからでもロボットを制御できるようにすることで、データ収集をクラウドソーシング化します。COBALT の主な革新は、ベクトル化環境アーキテクチャにあり、単一の GPU 上で最大 8 人の同時ユーザーがリアルタイムの遠隔操作を可能にし、エンドツーエンドのレイテンシは 100 ミリ秒未満を実現、従来の遠隔操作コストを大幅に削減します。さらに、VR ヘッドセット、3D マウス、キーボードなど複数のデバイスをサポートし、負荷分散とメモリ内データキャッシュにより制御の同期性と滑らかさを確保しています。研究チームはさらに、8 つの GPU 上で 256 のシミュレートクライアントを安定して動作させることを実証し、システムのハードウェア横断的なスケーラビリティを示しました。
包括的なユーザー調査では、スマートフォンベースの遠隔操作が、データ収集の速度と人間工学の面で専用ハードウェアと同等以上であることが示されました。データ品質を確保するため、COBALT はタスク完了時間や軌跡の滑らかさなどのリアルタイムメトリクスを記録し、最適でないデモンストレーションを自動的にフィルタリングします。また、構造化されたユーザートレーニングカリキュラムがデータ収集の質を大幅に向上させることが実証されました。これらの知見に基づき、研究チームは 9 カ国で 5 日間にわたって 7,500 以上のデモンストレーション(50 時間以上)からなるパイロットデータセットをクラウドソースで収集しました。このデータセットを用いて、行動クローニングや拡散ポリシーなどの最先端の模倣学習アルゴリズムをトレーニングし、COBALT プラットフォームの有効性を検証しました。この成果は、スケーラブルなロボット学習の新たな可能性を開き、家庭用サービスロボットや産業用ロボットなど、より広範なロボット応用への道を拓くものです。詳しくは、cobalt-teleop.github.io をご覧ください。