DynaHMRC:基于大语言模型的去中心化异构多机器人协作框架应对动态任务
本文提出DynaHMRC,一种去中心化框架,将每个机器人作为角色感知的大语言模型代理,通过四阶段闭环流程(自我描述、任务分配与领导权竞标、领导者选举、反思执行)实现异构多机器人团队的动态任务协作。该框架解决了集中式LLM调度器可扩展性差、对动态任务适应不足以及领域数据稀缺等问题。实验表明,DynaHMRC在成功率和效率上优于强基线方法,并展现出良好的可扩展性。
近年来,大语言模型(LLM)为机器人赋予了更强的任务理解与适应能力,在协调异构多机器人系统完成长周期任务方面展现出巨大潜力。然而,现有方法面临三大挑战:集中式LLM调度器随着团队规模和环境复杂度增加而扩展性下降,单个模型需处理过多上下文信息,长上下文近似可能降低推理质量;现有任务公式对动态场景考虑不足,而真实部署需要鲁棒适应不断变化的任务条件;领域数据稀缺限制了机器人专用推理,通用模型在专家任务中效率低下。
为解决这些问题,研究团队提出了DynaHMRC——一种去中心化框架。在该框架中,每个机器人均作为角色感知的LLM代理独立运行,从而缓解了单模型上下文瓶颈,并支持异构团队配置下的灵活协作。DynaHMRC将协作组织为四阶段闭环流程:自我描述、任务分配与领导权竞标、领导者选举、反思执行,整个过程由可执行的机器人接口支持。
为系统研究动态任务建模,团队还开发了一个基准测试,涵盖三种任务族、四种动态变化和六种团队配置。此外,通过实证分析指导领域专家数据集的构建,并对预训练LLM进行微调以提升专业能力。实验结果显示,DynaHMRC在成功率和执行效率上均优于强基线方法,且随着团队规模增长表现出良好的可扩展性趋势。
具体而言,在自我描述阶段,每个机器人向团队通报自身能力、角色和当前状态,形成共享的全局认知。随后进入任务分配与领导权竞标阶段,机器人根据自身能力与任务需求提出竞标,并竞争领导角色。领导者选举阶段通过投票或协商确定最终的领导者,负责协调任务执行。最后在反思执行阶段,机器人执行任务并反思结果,将经验反馈到下一轮循环中。这种闭环机制使团队能够不断适应动态变化的任务和环境。
团队设计的基准测试覆盖了物品搬运、环境探索和装配制造三类任务族,包括任务目标改变、机器人故障、环境障碍和通信中断等动态变化,以及从同质到高度异质的六种团队配置。这使得DynaHMRC的评估更加全面,也更能反映真实世界的复杂性。通过微调预训练LLM(如基于LLaMA的模型)在领域专家数据上,DynaHMRC进一步提升了在专业任务中的推理能力。