消失的崩盘:五模型经济中的控制与涌现
作者在构建小型AI代理经济模拟时发现,原本单一模型下会发生的市场崩盘,在换成五个不同实验室的小模型后消失了。通过多次尝试,作者意识到不能通过机械冲击来控制异质代理群体的行为,而应在结算环节施加确定性覆盖来获得可靠结果。
在《Build Small 黑客马拉松》的第三篇现场笔记中,作者Lester Leong讲述了一个关于经济模拟的教训。起初,他设计了一个名为“Oona的宝库挤兑”的寓言故事,本质上是将1929年的银行挤兑重新包装为林地民间传说。在一个单一模型驱动五个角色的系统中,当猫头鹰(负责管理蜂蜜的角色)阅读到恐慌情绪后开始清算库存,蜂蜜价格从10暴跌至3。这个未经过脚本编排的涌现行为令人印象深刻。
然而,当作者将系统重构为五个不同实验室的小模型各驱动一个角色时——包括OpenAI、NVIDIA、OpenBMB的模型以及作者自己微调的一个5亿参数模型——同样的场景却不再产生崩盘。作者做空蜂蜜并触发“Oona的宝库挤兑”谣言后,蜂蜜价格不跌反涨。这些异质模型在读到宝库空虚的谣言和作物歉收的提示后,非但没有抛售,反而开始囤积。做空交易亏损,系统旁白甚至讽刺地写道“蜂蜜赌局失手”。
作者尝试了三种外部干预:仅靠谣言、向每个角色注入大量蜂蜜造成供给过剩、以及加大做空规模,但均告失败。第一种尝试下,代理未抛售;第二种虽然对测试策略(一个基于规则的机械替代品)有效,但真实模型无视了供给过剩;第三种仅加大了损失。三次尝试分别亏损15、26、27颗鹅卵石,而原本的设想中这应是盈利策略。
最终,作者意识到问题的核心:在异质代理的经济体中,参考价格不是可调节的旋钮,而是代理实际交易行为的残留。要获得可靠的结果,不能通过更用力地推动涌现输入,而应在结算环节(即所有交易完成后的最后一个接缝处)施加确定性覆盖。在新的设计中,传说现在会在结算时直接覆盖参考价格,崩盘成为既定事实,做空交易因此获利。
作者的三个核心结论是:第一,涌现行为是偶然的而非持久的,在不同代理群体下可能消失;第二,无法通过冲击输入来控制代理市场,供给和需求杠杆仅能影响代理的自由选择;第三,快速迭代的廉价模拟器最容易误导,当它与真实代理结果冲突时,应相信真实代理。