2026-06-16站内改写2 分鐘閱讀更新: 2026-06-16

DynaHMRC：基於大語言模型的去中心化異構多機器人協作框架應對動態任務

本文提出DynaHMRC，一種去中心化框架，將每個機器人作為角色感知的大語言模型代理，通過四階段閉環流程（自我描述、任務分配與領導權競標、領導者選舉、反思執行）實現異構多機器人團隊的動態任務協作。該框架解決了集中式LLM調度器可擴展性差、對動態任務適應不足以及領域數據稀缺等問題。實驗表明，DynaHMRC在成功率和效率上優於強基線方法，並展現出良好的可擴展性。

來源arXiv Robotics作者: Wenhao Yu, Yu'ang Xie, Yifan Duan, Jie Peng, Guanting Ye, Ka-Veng Yuen, Yanyong Zhang, Jianmin Ji

近年來，大語言模型（LLM）為機器人賦予了更強的任務理解與適應能力，在協調異構多機器人系統完成長週期任務方面展現出巨大潛力。然而，現有方法面臨三大挑戰：集中式LLM調度器隨着團隊規模和環境複雜度增加而擴展性下降，單個模型需處理過多上下文信息，長上下文近似可能降低推理質量；現有任務公式對動態場景考慮不足，而真實部署需要魯棒適應不斷變化的任務條件；領域數據稀缺限制了機器人專用推理，通用模型在專家任務中效率低下。

為解決這些問題，研究團隊提出了DynaHMRC——一種去中心化框架。在該框架中，每個機器人均作為角色感知的LLM代理獨立運行，從而緩解了單模型上下文瓶頸，並支持異構團隊配置下的靈活協作。DynaHMRC將協作組織為四階段閉環流程：自我描述、任務分配與領導權競標、領導者選舉、反思執行，整個過程由可執行的機器人接口支持。

為系統研究動態任務建模，團隊還開發了一個基準測試，涵蓋三種任務族、四種動態變化和六種團隊配置。此外，通過實證分析指導領域專家數據集的構建，並對預訓練LLM進行微調以提升專業能力。實驗結果顯示，DynaHMRC在成功率和執行效率上均優於強基線方法，且隨着團隊規模增長表現出良好的可擴展性趨勢。

具體而言，在自我描述階段，每個機器人向團隊通報自身能力、角色和當前狀態，形成共享的全局認知。隨後進入任務分配與領導權競標階段，機器人根據自身能力與任務需求提出競標，並競爭領導角色。領導者選舉階段通過投票或協商確定最終的領導者，負責協調任務執行。最後在反思執行階段，機器人執行任務並反思結果，將經驗反饋到下一輪循環中。這種閉環機制使團隊能夠不斷適應動態變化的任務和環境。

團隊設計的基準測試覆蓋了物品搬運、環境探索和裝配製造三類任務族，包括任務目標改變、機器人故障、環境障礙和通信中斷等動態變化，以及從同質到高度異質的六種團隊配置。這使得DynaHMRC的評估更加全面，也更能反映真實世界的複雜性。通過微調預訓練LLM（如基於LLaMA的模型）在領域專家數據上，DynaHMRC進一步提升了在專業任務中的推理能力。