AI News HubLIVE
站内改写2 分で読了

DynaHMRC:大規模言語モデルを用いた動的タスクのための分散型異種マルチロボット協調フレームワーク

本論文では、各ロボットが役割認識型LLMエージェントとして動作する分散型フレームワークDynaHMRCを提案する。自己記述、タスク割り当てとリーダーシップ入札、リーダー選出、内省実行の4段階クローズドループプロセスにより、動的タスクにおける異種ロボットチームの柔軟な協調を実現する。集中型LLMスケジューラのスケーラビリティ問題、動的タスクへの適応不足、ドメイン固有データ不足に対処する。実験では、強力なベースラインよりも高い成功率と効率を示し、有望なスケーラビリティを実証した。

ソースarXiv Robotics著者: Wenhao Yu, Yu'ang Xie, Yifan Duan, Jie Peng, Guanting Ye, Ka-Veng Yuen, Yanyong Zhang, Jianmin Ji

近年、大規模言語モデル(LLM)はロボットにより豊富なタスク理解と適応能力をもたらし、長期的なタスクにおける異種マルチロボットシステムの調整に有望視されている。しかし、既存の手法には3つの主要な課題がある。集中型LLMスケジューラはチームサイズや環境の複雑さが増すにつれてスケーラビリティが低下し、単一モデルが過剰なコンテキスト情報を処理する必要があり、長いコンテキストの近似によって推論品質が低下する可能性がある。また、既存のタスク定式化は動的設定を十分に考慮しておらず、現実世界での展開には進化するタスク条件へのロバストな適応が不可欠である。さらに、ドメイン固有のデータ不足が専門的なロボット推論を制限し、汎用モデルでは専門タスクの効率が悪い。

これらの問題に対処するため、研究チームはDynaHMRCを提案した。この分散型フレームワークでは、各ロボットが役割認識型LLMエージェントとして動作する。この設計により、単一モデルのコンテキストボトルネックが緩和され、異種チーム構成での柔軟な協調が可能になる。DynaHMRCは協調を4段階のクローズドループプロセス(自己記述、タスク割り当てとリーダーシップ入札、リーダー選出、内省実行)として組織化し、実行可能なロボットインターフェースによってサポートされる。

さらに、動的タスクモデリングを体系的に研究するために、3つのタスクファミリ、4つの動的バリエーション、6つのチーム構成をカバーするベンチマークを開発した。また、ドメイン固有のエキスパートデータセット構築をガイドする実証分析を実施し、事前学習済みLLMをファインチューニングして専門能力を向上させた。実験の結果、DynaHMRCは強力なベースラインよりも高い成功率を、より少ないアクションとコミュニケーションステップで達成し、評価した設定内でチームサイズが増加しても有望なスケーラビリティ傾向を示した。

具体的には、自己記述段階で各ロボットが自身の能力、役割、現在の状態をチームに報告し、共有されたグローバル認知を形成する。次にタスク割り当てとリーダーシップ入札段階で、ロボットは自身の能力とタスク要件に基づいて入札し、リーダー役割を競う。リーダー選出段階では投票または協議により最終リーダーが決定され、タスク実行の調整を担当する。最後に内省実行段階でロボットはタスクを実行し、結果を内省して次のサイクルにフィードバックする。この閉ループメカニズムにより、チームは動的に変化するタスクや環境に継続的に適応できる。

チームが開発したベンチマークは、物品運搬、環境探索、組み立て製造の3つのタスクファミリをカバーし、タスク目標の変更、ロボット故障、環境障害、通信切断などの動的変化、および同種から高度に異種までの6つのチーム構成を含む。これにより、DynaHMRCの評価はより包括的になり、現実世界の複雑さをよりよく反映している。事前学習済みLLM(例えばLLaMAベースのモデル)をドメインエキスパートデータでファインチューニングすることにより、DynaHMRCは専門タスクにおける推論能力をさらに向上させている。