多智慧體大語言模型商議中的隱藏錨點
本文提出了一種新的動態系統模型,用於解釋多智慧體LLM商議如何透過每個智慧體的隱藏內部信念(錨點)影響群體決策。該模型揭示了經典共識規則無法解釋的現象:智慧體對正確答案的置信度可能超越初始信念的凸包範圍。透過三個開源模型家族的實驗,作者發現錨點的影響強度相近,但位置差異決定了商議是否能突破初始意見的限制。
近日,arXiv上釋出了一篇題為《Hidden Anchors in Multi-Agent LLM Deliberation》的研究論文,作者為Apurba Pokharel和Ram Dantu。該研究提出了一種新穎的數學模型,用於解釋多智慧體大型語言模型(LLM)商議過程中的內在機制。
多智慧體LLM商議(即多個LLM代理透過多輪交換和修改答案來達成共識)已被廣泛應用於提升推理能力和準確性,但其工作原理一直缺乏理論模型。研究人員注意到,這種商議過程與人類的社會決策過程非常相似:作為社會性動物,我們既受到群體的影響(即“從眾效應”,經典的意見動力學模型如DeGroot和Friedkin-Johnsen已有所描述),又受到自身內在信念的牽引——後者往往是經典模型所忽略的。
為了填補這一空白,該研究將多智慧體商議建模為一個閉環動態系統。在該系統中,每個智慧體攜帶一個隱藏的內部信念,稱之為“錨點”。這個錨點會持續地、不受鄰居影響地牽引智慧體的意見。研究表明,這個錨點可以透過商議過程中的觀察資料恢復出來。更重要的是,該模型能夠解釋一種經典共識規則所禁止的行為:智慧體對正確答案的置信度可以上升到超過任何智慧體初始水平的程度,從而逃出初始信念形成的“凸包”空間。
研究者進一步指出,透過檢查恢復的錨點是否能預測未見過的商議執行(即泛化能力),可以簡單地判斷一個模型是否真正由這種錨點驅動。在對三個開源模型家族的實驗中,他們發現錨點的存在是一個譜系,而非非此即彼。所有錨點的影響力大致相當,但其位置存在差異;只有當錨點遠離初始意見時,商議過程才會突破凸包,此時需要完整的閉環模型來進行準確描述。
該研究為多智慧體LLM系統的設計和最佳化提供了重要的理論視角,有助於理解群體智慧中個體信念與集體共識的複雜互動。論文包含13頁正文、6張圖和7張表,已提交至arXiv預印本平臺(編號:2606.19494)。