把握から巧みな操作へ:大規模把握事前学習による巧みな操作
本研究では、大規模な巧みな把握データセットを活用して、ロボットが関節工具を使用するタスクを支援する方法を探求する。研究者らは355k軌跡の事前学習データセットを構築し、階層的模倣学習フレームワークを採用、シミュレーションと実世界実験の両方でタスク成功率を大幅に向上させた。
近年、ロボットの巧みな操作の分野では顕著な進歩が見られるが、ほとんどの手法は特定のタスク向けの大規模なデモンストレーションデータに依存しており、汎化能力に限界がある。本論文では、大規模な巧みな把握データセットを事前学習に活用することで、ロボットの巧みな操作能力、特に関節工具の使用を強化する新しい手法を提案する。従来、巧みな把握データセットは主に把握生成やピックアンドプレイス操作に使用されてきたが、本研究ではその適用範囲を拡大し、関節工具の使用—ロボットがツールを取得し、接触を維持し、その可動部を操作する必要があるタスク—を支援する。研究チームは、高レベルの手のサブゴール予測と低レベルの目標条件付きコントローラからなる階層的模倣学習フレームワークを採用した。高レベルモジュールは現在の状態に基づいて手のキーポイントの目標位置を予測し、低レベルモジュールはこれらの目標を達成するための細かい指の動きを生成する。大規模な巧みな把握アノテーションから35.5万軌跡の把握事前学習データセットを構築し、低レベルコントローラの事前学習に使用して、豊富な接触先験を学習させる。その後、下流タスクのデモンストレーションで微調整を行い、特定のツール使用タスクに適応させる。この設定を評価するため、研究者らは6つの関節工具使用タスク(協調した指の動きが必要)を含むシミュレーションベンチマークDexCraftを導入した。例えば、はさみ、ペンチ、レンチなどの使用が含まれる。これらのタスクは、安定した把握と正確な操作の両方を同時に実現することを要求する。シミュレーションと実世界実験の両方で、本手法はエンドツーエンドの拡散ポリシーベースラインやスクラッチから学習した階層的ポリシーを上回った。実世界では、DP3と比較して全タスク成功率が33.3パーセントポイント向上し、約40%から73.3%に改善された。これらの結果は、把握データセットが把握合成のためのリソースとしてだけでなく、接触の多い巧みな操作のためのスケーラブルな事前学習データとしても機能することを示している。本論文はYing YuanらによってarXivで公開され、プロジェクトページで動画やコードが提供されている。この革新は、既存の大規模データセットを事前学習に利用することで、タスク固有のデータへの依存を減らし、複雑な操作タスクへのロボットの展開を加速する新しい視点を提供する。