多智能体大语言模型商议中的隐藏锚点
本文提出了一种新的动态系统模型,用于解释多智能体LLM商议如何通过每个智能体的隐藏内部信念(锚点)影响群体决策。该模型揭示了经典共识规则无法解释的现象:智能体对正确答案的置信度可能超越初始信念的凸包范围。通过三个开源模型家族的实验,作者发现锚点的影响强度相近,但位置差异决定了商议是否能突破初始意见的限制。
近日,arXiv上发布了一篇题为《Hidden Anchors in Multi-Agent LLM Deliberation》的研究论文,作者为Apurba Pokharel和Ram Dantu。该研究提出了一种新颖的数学模型,用于解释多智能体大型语言模型(LLM)商议过程中的内在机制。
多智能体LLM商议(即多个LLM代理通过多轮交换和修改答案来达成共识)已被广泛应用于提升推理能力和准确性,但其工作原理一直缺乏理论模型。研究人员注意到,这种商议过程与人类的社会决策过程非常相似:作为社会性动物,我们既受到群体的影响(即“从众效应”,经典的意见动力学模型如DeGroot和Friedkin-Johnsen已有所描述),又受到自身内在信念的牵引——后者往往是经典模型所忽略的。
为了填补这一空白,该研究将多智能体商议建模为一个闭环动态系统。在该系统中,每个智能体携带一个隐藏的内部信念,称之为“锚点”。这个锚点会持续地、不受邻居影响地牵引智能体的意见。研究表明,这个锚点可以通过商议过程中的观察数据恢复出来。更重要的是,该模型能够解释一种经典共识规则所禁止的行为:智能体对正确答案的置信度可以上升到超过任何智能体初始水平的程度,从而逃出初始信念形成的“凸包”空间。
研究者进一步指出,通过检查恢复的锚点是否能预测未见过的商议运行(即泛化能力),可以简单地判断一个模型是否真正由这种锚点驱动。在对三个开源模型家族的实验中,他们发现锚点的存在是一个谱系,而非非此即彼。所有锚点的影响力大致相当,但其位置存在差异;只有当锚点远离初始意见时,商议过程才会突破凸包,此时需要完整的闭环模型来进行准确描述。
该研究为多智能体LLM系统的设计和优化提供了重要的理论视角,有助于理解群体智能中个体信念与集体共识的复杂互动。论文包含13页正文、6张图和7张表,已提交至arXiv预印本平台(编号:2606.19494)。