AI News HubLIVE
站内改写2 分鐘閱讀

DynaHMRC:基於大語言模型的去中心化異構多機器人協作框架應對動態任務

本文提出DynaHMRC,一種去中心化框架,將每個機器人作為角色感知的大語言模型代理,通過四階段閉環流程(自我描述、任務分配與領導權競標、領導者選舉、反思執行)實現異構多機器人團隊的動態任務協作。該框架解決了集中式LLM調度器可擴展性差、對動態任務適應不足以及領域數據稀缺等問題。實驗表明,DynaHMRC在成功率和效率上優於強基線方法,並展現出良好的可擴展性。

來源arXiv Robotics作者: Wenhao Yu, Yu'ang Xie, Yifan Duan, Jie Peng, Guanting Ye, Ka-Veng Yuen, Yanyong Zhang, Jianmin Ji

近年來,大語言模型(LLM)為機器人賦予了更強的任務理解與適應能力,在協調異構多機器人系統完成長週期任務方面展現出巨大潛力。然而,現有方法面臨三大挑戰:集中式LLM調度器隨着團隊規模和環境複雜度增加而擴展性下降,單個模型需處理過多上下文信息,長上下文近似可能降低推理質量;現有任務公式對動態場景考慮不足,而真實部署需要魯棒適應不斷變化的任務條件;領域數據稀缺限制了機器人專用推理,通用模型在專家任務中效率低下。

為解決這些問題,研究團隊提出了DynaHMRC——一種去中心化框架。在該框架中,每個機器人均作為角色感知的LLM代理獨立運行,從而緩解了單模型上下文瓶頸,並支持異構團隊配置下的靈活協作。DynaHMRC將協作組織為四階段閉環流程:自我描述、任務分配與領導權競標、領導者選舉、反思執行,整個過程由可執行的機器人接口支持。

為系統研究動態任務建模,團隊還開發了一個基準測試,涵蓋三種任務族、四種動態變化和六種團隊配置。此外,通過實證分析指導領域專家數據集的構建,並對預訓練LLM進行微調以提升專業能力。實驗結果顯示,DynaHMRC在成功率和執行效率上均優於強基線方法,且隨着團隊規模增長表現出良好的可擴展性趨勢。

具體而言,在自我描述階段,每個機器人向團隊通報自身能力、角色和當前狀態,形成共享的全局認知。隨後進入任務分配與領導權競標階段,機器人根據自身能力與任務需求提出競標,並競爭領導角色。領導者選舉階段通過投票或協商確定最終的領導者,負責協調任務執行。最後在反思執行階段,機器人執行任務並反思結果,將經驗反饋到下一輪循環中。這種閉環機制使團隊能夠不斷適應動態變化的任務和環境。

團隊設計的基準測試覆蓋了物品搬運、環境探索和裝配製造三類任務族,包括任務目標改變、機器人故障、環境障礙和通信中斷等動態變化,以及從同質到高度異質的六種團隊配置。這使得DynaHMRC的評估更加全面,也更能反映真實世界的複雜性。通過微調預訓練LLM(如基於LLaMA的模型)在領域專家數據上,DynaHMRC進一步提升了在專業任務中的推理能力。