2026-06-16站内改写2 分钟阅读更新: 2026-06-16

DynaHMRC：基于大语言模型的去中心化异构多机器人协作框架应对动态任务

本文提出DynaHMRC，一种去中心化框架，将每个机器人作为角色感知的大语言模型代理，通过四阶段闭环流程（自我描述、任务分配与领导权竞标、领导者选举、反思执行）实现异构多机器人团队的动态任务协作。该框架解决了集中式LLM调度器可扩展性差、对动态任务适应不足以及领域数据稀缺等问题。实验表明，DynaHMRC在成功率和效率上优于强基线方法，并展现出良好的可扩展性。

来源arXiv Robotics作者: Wenhao Yu, Yu'ang Xie, Yifan Duan, Jie Peng, Guanting Ye, Ka-Veng Yuen, Yanyong Zhang, Jianmin Ji

近年来，大语言模型（LLM）为机器人赋予了更强的任务理解与适应能力，在协调异构多机器人系统完成长周期任务方面展现出巨大潜力。然而，现有方法面临三大挑战：集中式LLM调度器随着团队规模和环境复杂度增加而扩展性下降，单个模型需处理过多上下文信息，长上下文近似可能降低推理质量；现有任务公式对动态场景考虑不足，而真实部署需要鲁棒适应不断变化的任务条件；领域数据稀缺限制了机器人专用推理，通用模型在专家任务中效率低下。

为解决这些问题，研究团队提出了DynaHMRC——一种去中心化框架。在该框架中，每个机器人均作为角色感知的LLM代理独立运行，从而缓解了单模型上下文瓶颈，并支持异构团队配置下的灵活协作。DynaHMRC将协作组织为四阶段闭环流程：自我描述、任务分配与领导权竞标、领导者选举、反思执行，整个过程由可执行的机器人接口支持。

为系统研究动态任务建模，团队还开发了一个基准测试，涵盖三种任务族、四种动态变化和六种团队配置。此外，通过实证分析指导领域专家数据集的构建，并对预训练LLM进行微调以提升专业能力。实验结果显示，DynaHMRC在成功率和执行效率上均优于强基线方法，且随着团队规模增长表现出良好的可扩展性趋势。

具体而言，在自我描述阶段，每个机器人向团队通报自身能力、角色和当前状态，形成共享的全局认知。随后进入任务分配与领导权竞标阶段，机器人根据自身能力与任务需求提出竞标，并竞争领导角色。领导者选举阶段通过投票或协商确定最终的领导者，负责协调任务执行。最后在反思执行阶段，机器人执行任务并反思结果，将经验反馈到下一轮循环中。这种闭环机制使团队能够不断适应动态变化的任务和环境。

团队设计的基准测试覆盖了物品搬运、环境探索和装配制造三类任务族，包括任务目标改变、机器人故障、环境障碍和通信中断等动态变化，以及从同质到高度异质的六种团队配置。这使得DynaHMRC的评估更加全面，也更能反映真实世界的复杂性。通过微调预训练LLM（如基于LLaMA的模型）在领域专家数据上，DynaHMRC进一步提升了在专业任务中的推理能力。