2026-07-05 17:06 UTC+8站内改写2 分钟阅读更新: 2026-07-05 17:43 UTC+8

通过Sheaf-ADMM学习多智能体协调

Sheaf-ADMM结合了层论和交替方向乘子法（ADMM），使得多个智能体能够通过局部子问题的求解和邻居间的协商实现去中心化共识，无需中央协调器。在图像分类、多智能体数独和迷宫寻路等任务中，该方法表现出高效率和可解释性。

来源Hacker News AI作者: hardmaru

Sheaf-ADMM是一种新颖的多智能体协调框架，由Sakana AI的研究团队提出。该框架将层论（sheaf theory）与交替方向乘子法（ADMM）相结合，使得多个智能体能够在没有中央协调器的情况下，通过局部交互实现全局共识。

在多智能体系统中，每个智能体仅能观察到环境的一小部分，并与邻居通信。传统的集中式方法依赖一个协调者分配子任务，但在许多实际场景中，例如传感器网络、蚁群或神经系统，这种中央节点并不存在。Sheaf-ADMM正是为这种分布式环境而设计。

该框架的核心创新在于利用层论定义智能体之间的共识条件。具体来说，每个智能体持有私有状态向量，邻居之间通过线性投影（限制映射）达成一致，而非要求完全相同的状态。这种设计比传统共识更灵活，且具有拓扑学支撑。ADMM则提供了求解协议：每个智能体解决一个本地子问题，然后通过层扩散（sheaf diffusion）与邻居协商，并积累对偶变量以推动收敛。这个过程迭代进行，直到系统达到全局一致。

在实验中，研究团队在多个简单任务上验证了该方法的有效性。在多智能体数独难题中，每个智能体仅看到棋盘的一个局部区域，如一行、一列或一个3×3宫格，相邻智能体仅共享单元格。Sheaf-ADMM达到了92.6%的求解率，而传统的消息传递神经网络（MPNN）基线只有34.7%。这得益于Sheaf-ADMM自然地利用了问题的“分而治之”结构。

在迷宫寻路任务中，Sheaf-ADMM展示了通信效率的优势。每个智能体携带本地状态变量（x, z, u），通过ADMM分裂降低了对通信带宽的需求。实验表明，在相同带宽下，Sheaf-ADMM能解决更大规模的迷宫，而MPNN需要更宽的通信通道。

此外，Sheaf-ADMM的线性通信机制使其高度可解释。每个智能体的状态变量（x, z, u）均可视化，协商过程清晰可见。研究展示了智能体在迷宫寻路中，其潜在状态如何随迭代而演变，最终收敛到全局解。这种透明性为未来研究拓扑障碍、顽固智能体等高级话题奠定了基础。

该研究的论文发表在arXiv（编号2605.31005），代码已开源。尽管当前工作聚焦于简单任务，但作者认为，Sheaf-ADMM为本质上分布式的复杂问题（如完全去中心化的系统）提供了新的解决思路。未来的方向包括异步更新、拜占庭容错、非凸扩展以及更深入的拓扑分析。