2026-05-18 12:00 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

基于混合大语言模型的机器人任务调度智能框架

该研究提出了一种利用大语言模型（LLM）优化建筑机器人任务调度的智能框架。系统通过自然语言处理接口与建筑专业人员交互，并实时适应突发工地情况。框架采用双LLM代理架构：生成器（GPT-4）和监督器（Gemma 3/Llama 4/Mistral 7b），以提供更精确的任务计划。评估结果显示，LLM在建筑机器人操作任务中具有关键作用。

来源arXiv Robotics作者: Swayamjit Saha, Subhabrata Das, Haonan Duan, Xiao-Yang Liu

近日，一篇提交至arXiv的论文提出了一种基于大语言模型（LLM）的混合智能框架，旨在优化建筑机器人的任务调度问题。该研究由Swayamjit Saha等人完成，论文编号为arXiv:2605.15486，于2026年5月15日提交。研究团队来自机器人学和人工智能领域，论文篇幅为9页，包含5张图表。

建筑工地环境复杂多变，机器人需要高效地执行任务，同时应对突发状况。传统调度方法往往缺乏灵活性和实时适应能力。为此，研究者引入了LLM来增强调度系统的智能化水平。该框架以关键任务数据（如机器人动作能力、目标结果）作为输入，开发了平衡分配策略，兼顾时间效率和资源利用率。

系统的一大特色是采用了双LLM代理架构：一个生成器（基于GPT-4）负责任务规划的初步生成，另一个监督器（可选的Gemma 3、Llama 4或Mistral 7b）则对生成结果进行校验和优化，从而提升调度的准确性。这种设计利用了不同LLM的互补优势，确保任务计划的可靠性和精确性。此外，系统配备了自然语言处理（NLP）接口，使建筑专业人员能够用自然语言与系统交互，大大降低了使用门槛，使得非技术用户也能轻松参与调度过程。

在评估阶段，研究者通过一个简单场景验证了框架的有效性，并提供了度量分数。结果显示，该框架在任务完成时间和资源利用方面均表现优异，证明了LLM在建筑机器人操作中的巨大潜力。研究还指出，双代理架构比单一LLM方法具有更好的鲁棒性和准确性。

该研究目前已有9页正文和5张图表，后续可能进一步扩展至更复杂的实际建筑场景。作者表示，这一框架为未来智能建筑中的人机协作提供了新思路，有望推动建筑行业自动化的进程。论文已被归类为机器人学（cs.RO）和人工智能（cs.AI）主题，并提供了DOI链接供引用。