2026-05-18 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

基於混合大語言模型的機器人任務調度智能框架

該研究提出了一種利用大語言模型（LLM）優化建築機器人任務調度的智能框架。系統通過自然語言處理接口與建築專業人員交互，並實時適應突發工地情況。框架採用雙LLM代理架構：生成器（GPT-4）和監督器（Gemma 3/Llama 4/Mistral 7b），以提供更精確的任務計劃。評估結果顯示，LLM在建築機器人操作任務中具有關鍵作用。

來源arXiv Robotics作者: Swayamjit Saha, Subhabrata Das, Haonan Duan, Xiao-Yang Liu

近日，一篇提交至arXiv的論文提出了一種基於大語言模型（LLM）的混合智能框架，旨在優化建築機器人的任務調度問題。該研究由Swayamjit Saha等人完成，論文編號為arXiv:2605.15486，於2026年5月15日提交。研究團隊來自機器人學和人工智能領域，論文篇幅為9頁，包含5張圖表。

建築工地環境複雜多變，機器人需要高效地執行任務，同時應對突發狀況。傳統調度方法往往缺乏靈活性和實時適應能力。為此，研究者引入了LLM來增強調度系統的智能化水平。該框架以關鍵任務數據（如機器人動作能力、目標結果）作為輸入，開發了平衡分配策略，兼顧時間效率和資源利用率。

系統的一大特色是採用了雙LLM代理架構：一個生成器（基於GPT-4）負責任務規劃的初步生成，另一個監督器（可選的Gemma 3、Llama 4或Mistral 7b）則對生成結果進行校驗和優化，從而提升調度的準確性。這種設計利用了不同LLM的互補優勢，確保任務計劃的可靠性和精確性。此外，系統配備了自然語言處理（NLP）接口，使建築專業人員能夠用自然語言與系統交互，大大降低了使用門檻，使得非技術用户也能輕鬆參與調度過程。

在評估階段，研究者通過一個簡單場景驗證了框架的有效性，並提供了度量分數。結果顯示，該框架在任務完成時間和資源利用方面均表現優異，證明了LLM在建築機器人操作中的巨大潛力。研究還指出，雙代理架構比單一LLM方法具有更好的魯棒性和準確性。

該研究目前已有9頁正文和5張圖表，後續可能進一步擴展至更復雜的實際建築場景。作者表示，這一框架為未來智能建築中的人機協作提供了新思路，有望推動建築行業自動化的進程。論文已被歸類為機器人學（cs.RO）和人工智能（cs.AI）主題，並提供了DOI鏈接供引用。