消失的崩盤:五模型經濟中的控制與湧現
作者在構建小型AI代理經濟模擬時發現,原本單一模型下會發生的市場崩盤,在換成五個不同實驗室的小模型後消失了。通過多次嘗試,作者意識到不能通過機械衝擊來控制異質代理羣體的行為,而應在結算環節施加確定性覆蓋來獲得可靠結果。
在《Build Small 黑客馬拉松》的第三篇現場筆記中,作者Lester Leong講述了一個關於經濟模擬的教訓。起初,他設計了一個名為“Oona的寶庫擠兑”的寓言故事,本質上是將1929年的銀行擠兑重新包裝為林地民間傳説。在一個單一模型驅動五個角色的系統中,當貓頭鷹(負責管理蜂蜜的角色)閲讀到恐慌情緒後開始清算庫存,蜂蜜價格從10暴跌至3。這個未經過腳本編排的湧現行為令人印象深刻。
然而,當作者將系統重構為五個不同實驗室的小模型各驅動一個角色時——包括OpenAI、NVIDIA、OpenBMB的模型以及作者自己微調的一個5億參數模型——同樣的場景卻不再產生崩盤。作者做空蜂蜜並觸發“Oona的寶庫擠兑”謠言後,蜂蜜價格不跌反漲。這些異質模型在讀到寶庫空虛的謠言和作物歉收的提示後,非但沒有拋售,反而開始囤積。做空交易虧損,系統旁白甚至諷刺地寫道“蜂蜜賭局失手”。
作者嘗試了三種外部干預:僅靠謠言、向每個角色注入大量蜂蜜造成供給過剩、以及加大做空規模,但均告失敗。第一種嘗試下,代理未拋售;第二種雖然對測試策略(一個基於規則的機械替代品)有效,但真實模型無視了供給過剩;第三種僅加大了損失。三次嘗試分別虧損15、26、27顆鵝卵石,而原本的設想中這應是盈利策略。
最終,作者意識到問題的核心:在異質代理的經濟體中,參考價格不是可調節的旋鈕,而是代理實際交易行為的殘留。要獲得可靠的結果,不能通過更用力地推動湧現輸入,而應在結算環節(即所有交易完成後的最後一個接縫處)施加確定性覆蓋。在新的設計中,傳説現在會在結算時直接覆蓋參考價格,崩盤成為既定事實,做空交易因此獲利。
作者的三個核心結論是:第一,湧現行為是偶然的而非持久的,在不同代理羣體下可能消失;第二,無法通過沖擊輸入來控制代理市場,供給和需求槓桿僅能影響代理的自由選擇;第三,快速迭代的廉價模擬器最容易誤導,當它與真實代理結果衝突時,應相信真實代理。