AI News HubLIVE
站内改写1 分鐘閱讀

多智能體大語言模型商議中的隱藏錨點

本文提出了一種新的動態系統模型,用於解釋多智能體LLM商議如何通過每個智能體的隱藏內部信念(錨點)影響羣體決策。該模型揭示了經典共識規則無法解釋的現象:智能體對正確答案的置信度可能超越初始信念的凸包範圍。通過三個開源模型家族的實驗,作者發現錨點的影響強度相近,但位置差異決定了商議是否能突破初始意見的限制。

來源arXiv AI作者: Apurba Pokharel, Ram Dantu

近日,arXiv上發佈了一篇題為《Hidden Anchors in Multi-Agent LLM Deliberation》的研究論文,作者為Apurba Pokharel和Ram Dantu。該研究提出了一種新穎的數學模型,用於解釋多智能體大型語言模型(LLM)商議過程中的內在機制。

多智能體LLM商議(即多個LLM代理通過多輪交換和修改答案來達成共識)已被廣泛應用於提升推理能力和準確性,但其工作原理一直缺乏理論模型。研究人員注意到,這種商議過程與人類的社會決策過程非常相似:作為社會性動物,我們既受到羣體的影響(即“從眾效應”,經典的意見動力學模型如DeGroot和Friedkin-Johnsen已有所描述),又受到自身內在信念的牽引——後者往往是經典模型所忽略的。

為了填補這一空白,該研究將多智能體商議建模為一個閉環動態系統。在該系統中,每個智能體攜帶一個隱藏的內部信念,稱之為“錨點”。這個錨點會持續地、不受鄰居影響地牽引智能體的意見。研究表明,這個錨點可以通過商議過程中的觀察數據恢復出來。更重要的是,該模型能夠解釋一種經典共識規則所禁止的行為:智能體對正確答案的置信度可以上升到超過任何智能體初始水平的程度,從而逃出初始信念形成的“凸包”空間。

研究者進一步指出,通過檢查恢復的錨點是否能預測未見過的商議運行(即泛化能力),可以簡單地判斷一個模型是否真正由這種錨點驅動。在對三個開源模型家族的實驗中,他們發現錨點的存在是一個譜系,而非非此即彼。所有錨點的影響力大致相當,但其位置存在差異;只有當錨點遠離初始意見時,商議過程才會突破凸包,此時需要完整的閉環模型來進行準確描述。

該研究為多智能體LLM系統的設計和優化提供了重要的理論視角,有助於理解羣體智能中個體信念與集體共識的複雜互動。論文包含13頁正文、6張圖和7張表,已提交至arXiv預印本平台(編號:2606.19494)。