智慧體應如何交流?面向高效多智慧體系統的動作狀態通訊
多智慧體系統(MAS)通常依賴自由形式的自然語言通訊,導致令牌消耗激增和效能下降。本文分析了五種通訊策略,提出PACT協議,將通訊視為狀態更新問題,顯著提升效能-成本平衡,在OpenHands和SWE-agent等實際系統中驗證了有效性。
近日,一篇由Chen Huang、Yuhao Wu和Wenxuan Zhang共同撰寫的研究論文《What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems》在arXiv上釋出。該論文深入探討了基於大型語言模型(LLM)的多智慧體系統(MAS)中智慧體間通訊效率的問題,並提出了一個名為PACT(Protocolized Action-state Communication and Transmission)的新協議以最佳化通訊過程。
在當前的MAS架構中,智慧體通常按照角色、處理流水線和輪次排程進行組織,但智慧體之間傳遞的訊息卻幾乎沒有受到約束,往往採用自由形式的自然語言。這種自由形式的通訊看似靈活,實則帶來了嚴重的問題:它會快速消耗大量的令牌(token),佔用有限的共享上下文視窗,從而嚴重影響系統的整體效能和推理成本。為了解決這一問題,研究人員首先對兩種典型MAS拓撲結構下的五種常見智慧體間通訊策略進行了系統性的分析。分析結果表明,沒有哪一種固定的通訊策略是普遍最優的;相反,有效的智慧體間訊息往往能夠保留下游智慧體所需的以動作為核心的資訊。
基於上述發現,研究者提出了PACT協議。該協議將智慧體間的通訊建模為一個公共狀態更新問題,在原始智慧體輸出被納入共享歷史之前,將其投影為緊湊的動作狀態記錄。這種處理方式大幅壓縮了通訊內容,同時保留了任務執行所需的關鍵資訊。
為了驗證PACT的有效性,研究人員在不同的MAS拓撲結構中進行了大量實驗。實驗結果顯示,PACT始終能夠在效能與成本之間實現更優的權衡——在顯著減少令牌使用量的同時,達到甚至超過原有的任務效能。尤其在真實的編碼任務中,PACT的表現尤為突出:它使OpenHands在每解決一個任務所消耗的令牌數上實現了10%的改善,而在SWE-agent上,PACT在保持解決率不變的情況下,將輸入令牌用量減少了一半。
該研究不僅為多智慧體系統的通訊設計提供了重要的理論指導,也透過具體的實驗資料展示了PACT在實際應用中的巨大潛力。研究團隊已將相關程式碼公開在GitHub上,供學術界和工業界進一步研究和應用。