AI News HubLIVE
站内改写2 分で読了

WorkBenchMark: スマートマニュファクチャリングリーグのためのLEGOベース組立ベンチマークと「分解による組立」ベースライン

WorkBenchMarkは、RoboCupスマートマニュファクチャリングリーグに触発されたLEGO Duploベースのロボット組立ベンチマークです。400のタスクを4つの複雑度レベルで提供し、オープンボキャブラリ認識と「分解による組立」ベースラインソリューションを提案します。計画ベースのパイプラインは、すべてのレベルで最新の視覚-言語-行動アプローチを上回ります。ベンチマーク、シミュレーション環境、ベースライン実装はオープンに公開されます。

ソースarXiv Robotics著者: Wenbo Ma, Daniel Swoboda, Matteo Tschesche, Till Hofmann

このたび、研究チームはarXiv上でWorkBenchMarkを発表しました。これは、RoboCupスマートマニュファクチャリングリーグのためのLEGO Duploブロックを用いたロボット組立ベンチマークです。ロボット組立タスクは、低レベルの操作と高レベルの記号推論を物理的制約下で組み合わせる必要があり、現在のエンドツーエンド学習手法では信頼性高く解決できていません。WorkBenchMarkは、4段階の複雑度に分類された400のタスクを提供し、ロボットの組立能力を総合的に評価します。各レベルのタスクは難易度が段階的に上がり、単純な積み重ねから複雑な構造の組み立てまで多様なシナリオを含みます。このベンチマークは、現実の製造における典型的な要求、例えば部品の認識、把持、位置決め、組み合わせ、および不確実性への対応を考慮して設計されています。この課題に対処するため、研究チームはオープンボキャブラリ認識に基づく「分解による組立」ベースラインソリューションを提案しました。この計画駆動型パイプラインは、複雑な組立タスクを管理可能な分解ステップに分割することで、タスクの難易度を低減します。具体的には、オープンボキャブラリの視覚言語モデルを用いて部品と組立関係を認識し、記号プランナーが一連の分解動作を生成、それを逆向きに組立に適用します。実験の結果、この計画ベースラインは、すべての複雑度レベルにおいて最新の視覚-言語-行動(VLA)手法を上回る性能を示し、組立タスクにおける記号推論ベースの計画手法の優位性が確認されました。例えば、最高複雑度レベルでは、計画ベースラインの成功率がVLA手法より約30%高くなりました。WorkBenchMarkは、豊富なタスクセットとベースライン手法に加えて、ベンチマーク、シミュレーション環境、およびベースライン実装コードを公開し、ロボット組立コミュニティのさらなる研究を促進する予定です。本論文はRoboCup Symposium 2026に採択されており、スマートマニュファクチャリングとロボット操作の交差点における重要な一歩となります。今後、チームは多様な部品タイプやタスクパターンへのベンチマーク拡張、学習と計画のより緊密な統合を目指しています。