從信號到結構:記憶架構如何驅動LLM智能體的語言湧現
一項新研究通過Lewis信號遊戲比較了五種記憶架構,發現配備持久私人筆記本的LLM智能體在協調任務中表現最優,且記憶架構比通道容量更重要。
如何讓兩個智能體從零開始發明一種共享語言?這是語言演化研究中的核心問題。一項由Yashar Talebirad等人進行的最新研究利用Lewis信號遊戲對此進行了深入探索。在經典Lewis信號遊戲中,一個發送者看到一個物體後必須發送一個信號,接收者根據信號選擇物體,雙方僅通過交互歷史來協調出一個共同代碼,沒有預先約定的詞彙表。研究者使用大型語言模型(LLM)作為智能體,測試了五種不同的記憶架構,並變化通道容量(即可能的信號數量),以觀察哪些因素最能促進成功的協調。
實驗結果表明,記憶架構的影響力遠超通道容量本身。配備持久私人筆記本的智能體表現最為出色:它們能夠充分利用多餘的通道容量,避免了無狀態智能體在高容量時出現的協調崩潰現象。在通道容量為25時,這些筆記本智能體取得了最可靠的協調錶現,協調度達到0.867±0.023。筆記本的作用在於將學到的慣例外部化,使得智能體無需每輪重新推導代碼,從而穩定了通信過程,並防止了詞彙的無序增長。
相比之下,無狀態智能體僅在中等通道容量時表現最佳,一旦詞彙量增長超出滾動上下文窗口的追蹤能力,性能便急劇下降。這揭示了當前基於上下文窗口的LLM智能體的一個根本侷限:在缺乏外部記憶的情況下,歷史信息容易丟失,導致協調不穩定。
研究還挑戰了基於信息瓶頸理論的傳統觀點。該理論預測最優通道容量應等於需要區分的物體數量(實驗中為8個)。但實驗發現,容量等於8時系統協調反而最不穩定,成為一個脆弱點;而多餘的容量通常更為有利。因此,通道容量本身無法預測協調結果;記憶架構決定了智能體能否將交互歷史轉化為穩定的慣例。要理解信號如何演變為語言,這兩個維度缺一不可。
該研究已提交至arXiv(編號2607.00233),涉及人工智能、計算與語言、信息論及多智能體系統等多個領域,為理解LLM智能體中的語言湧現提供了重要視角。