AI News HubLIVE
站内改写2 分钟阅读

千符森林:在3B模型上运行多智能体经济

一篇关于在Build Small Hackathon中构建的微型多智能体经济模拟的现场报告,使用Qwen2.5-3B模型驱动五个林间生物进行贸易、囤积和恐慌。文章探讨了小型模型在实时仿真中的可行性、设计稀缺性的必要性以及如何通过提示工程弥补模型推理能力的不足。

在Build Small Hackathon中,Lester Leong(AdmiralTaco)构建了一个名为“Thousand Token Wood”的微型多智能体经济模拟系统。该系统使用Qwen2.5-3B模型驱动五个林间生物(如猫头鹰、松鼠等)进行商品交易、囤积和恐慌行为。所有模型通过Modal上的vLLM提供服务,并通过Gradio应用展示。

项目的核心在于展示小型模型在实时多智能体仿真中的可行性。相比前沿大模型,小型模型成本低、速度快,使得每个时间步所有智能体能够通过一次批量GPU调用做出决策。然而,最初的版本因缺乏稀缺性而失败:生产大于消费,每个生物自给自足,贸易无从发生。修复方案是引入三种稀缺机制:饮食多样性(每餐只能吃一种食物)、易腐性(食物会腐烂)以及冬季燃料危机(所有生物需要燃烧木柴取暖)。其中,木柴只有一个生产者,需求随时间增长,导致木柴价格飙升,木匠致富,其他生物竞争取暖。

在稀缺性就位后,3B模型暴露出其推理能力的局限。虽然100%的调用都能生成有效的JSON,但经济判断力差,例如橡子生产者会下单购买橡子。解决方案不是换更大的模型,而是优化提示词。作者为每个智能体指定了生产物和禁止购买物,计算其短缺商品清单,并提供一个工作示例。决策质量显著提升。整个循环还包裹了容错的JSON解析和修复层,避免因格式错误导致崩溃。

福利系统的设计也经历了迭代。最初作为累加器模型导致长期赤字使所有生物归零,形成死亡螺旋。后来改为均值回归的情绪模型,当生物吃饱喝足时恢复,永远不会降到零,从而将风险转移到价格和地位上。

项目最引人注目的功能是将历史市场事件重新包装为林地传说。玩家可以绘制“木材传说”,例如郁金香狂热被重写为“大橡果狂热”,南海泡沫成为“空心木交易公司”,1929年的银行挤兑变成“对乌娜财宝的挤兑”。这些传说并非仅添加风味文字,而是会触发真实的经济冲击。在一次运行中,乌娜(猫头鹰)的宝库被传为空,她开始抛售蜂蜜以筹集鹅卵石,导致蜂蜜价格从10暴跌至3。所有反应均非脚本编写。

为了使价格波动可见,作者让市场参考价格随未满足的供需漂移:大量未成交的买单推高价格,供应过剩则压低价格。最终,15轮运行的数据显示:有效JSON动作100%,每轮交易3-9笔,蜂蜜价格在银行挤兑传说中从10跌至3,木柴价格因冬季稀缺从4升至7,财富基尼系数从0.14扩大到0.38,最终木匠成为最富者,囤积者破产。

作者总结的经验包括:小型模型工程的核心在于利用其可靠的格式化输出,同时通过结构和提示弥补其不可靠的推理;涌现系统需要设计稀缺性;最吸引人的小型模型演示无需虚构戏剧,几个世纪的市场历史足矣,而一群3B智能体足以演绎这些故事。