2026-06-06 12:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

智能体应如何交流？面向高效多智能体系统的动作状态通信

多智能体系统（MAS）通常依赖自由形式的自然语言通信，导致令牌消耗激增和性能下降。本文分析了五种通信策略，提出PACT协议，将通信视为状态更新问题，显著提升性能-成本平衡，在OpenHands和SWE-agent等实际系统中验证了有效性。

来源arXiv AI作者: Chen Huang, Yuhao Wu, Wenxuan Zhang

近日，一篇由Chen Huang、Yuhao Wu和Wenxuan Zhang共同撰写的研究论文《What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems》在arXiv上发布。该论文深入探讨了基于大型语言模型（LLM）的多智能体系统（MAS）中智能体间通信效率的问题，并提出了一个名为PACT（Protocolized Action-state Communication and Transmission）的新协议以优化通信过程。

在当前的MAS架构中，智能体通常按照角色、处理流水线和轮次调度进行组织，但智能体之间传递的消息却几乎没有受到约束，往往采用自由形式的自然语言。这种自由形式的通信看似灵活，实则带来了严重的问题：它会快速消耗大量的令牌（token），占用有限的共享上下文窗口，从而严重影响系统的整体性能和推理成本。为了解决这一问题，研究人员首先对两种典型MAS拓扑结构下的五种常见智能体间通信策略进行了系统性的分析。分析结果表明，没有哪一种固定的通信策略是普遍最优的；相反，有效的智能体间消息往往能够保留下游智能体所需的以动作为核心的信息。

基于上述发现，研究者提出了PACT协议。该协议将智能体间的通信建模为一个公共状态更新问题，在原始智能体输出被纳入共享历史之前，将其投影为紧凑的动作状态记录。这种处理方式大幅压缩了通信内容，同时保留了任务执行所需的关键信息。

为了验证PACT的有效性，研究人员在不同的MAS拓扑结构中进行了大量实验。实验结果显示，PACT始终能够在性能与成本之间实现更优的权衡——在显著减少令牌使用量的同时，达到甚至超过原有的任务性能。尤其在真实的编码任务中，PACT的表现尤为突出：它使OpenHands在每解决一个任务所消耗的令牌数上实现了10%的改善，而在SWE-agent上，PACT在保持解决率不变的情况下，将输入令牌用量减少了一半。

该研究不仅为多智能体系统的通信设计提供了重要的理论指导，也通过具体的实验数据展示了PACT在实际应用中的巨大潜力。研究团队已将相关代码公开在GitHub上，供学术界和工业界进一步研究和应用。