思维经济:通过经济交互涌现的多智能体智能
受哈耶克市场理论启发,研究人员提出一种基于拍卖、支付和财富积累的智能体经济系统,使智能体无需集中控制即可自发形成集体智能。该系统在数学推理、金融研究等任务上超越了传统单体模型,为多智能体系统设计提供了新思路。
来自 Zhenting Qi 等 16 位研究者的最新论文《Economy of Minds》提出了一种新颖的多智能体框架,其灵感来源于经济学家弗里德里希·哈耶克关于市场去中心化协调的理论。该框架的核心思想是:让一群初始能力较弱的智能体通过经济互动来自我组织和适应,从而涌现出更强大的集体智能,整个过程无需中心化控制或显式的通信协议。
在这套经济系统中,智能体通过拍卖竞争执行任务的权利,并使用虚拟货币进行支付。它们从环境中获取奖励并将其积累为财富。在拍卖过程中,每个智能体根据当前状态和自身能力对行动权进行竞标,出价最高的智能体获得执行权并支付相应金额。这种机制确保了最有能力的智能体能够获得关键行动机会。环境反馈的奖励则作为收入,智能体据此调整策略。这些简单的经济信号实际上起到了全局信用分配的作用,引导智能体进行规划和决策。系统还引入了经济选择机制:表现高效的智能体能够积累财富,并通过“利用”操作产生变异;而低效的智能体则走向破产,被“探索”操作生成的新智能体所取代。这种经济选择机制类似于自然选择,通过财富的积累与破产实现群体的进化。
研究团队在五个具有挑战性的智能体任务上评估了该系统的性能:数学推理、金融研究、科学研究、加速器设计以及分布式系统优化。这些任务涵盖了需要多步推理和策略规划的复杂场景。实验结果表明,即使初始智能体能力较弱,这个经济系统也能自发产生多步推理策略,并超越更强大的单一模型基线。在每个任务上,经济系统都展现出了优于传统单一模型的性能,特别是在需要多步推理的复杂场景中。此外,研究还提供了理论分析,揭示了经济动态如何塑造智能体行为,并将局部激励与长期全局性能联系起来。这项工作开辟了一条通往多智能体智能的新路径:与其设计复杂的协调机制,不如构建去中心化的激励结构,让智能自动涌现。