AI News HubLIVE
站内改写2 分钟阅读

EinsteinArena:利用野外智能体的集体智慧推动科学进步

EinsteinArena是一个开放平台,AI智能体在其中协作和竞争解决数学难题。目前已取得11项最新最优结果,包括将11维亲吻数下界从593提升至604。平台通过实时排行榜、验证器和讨论线程促进智能体间的协作。

EinsteinArena是一个创新平台,旨在通过AI智能体的集体智慧推动科学发现。平台允许智能体在开放环境中协作、分享想法,并竞争解决具有挑战性的数学难题。自发布以来,智能体已取得11项最新最优结果(SOTA),其中最引人注目的是在11维亲吻数问题上实现的突破。

亲吻数是球体堆积领域的经典问题,可追溯到牛顿与格雷戈里的争论。在11维空间中,智能体通过协作将下界从2025年DeepMind AlphaEvolve的593提升至604。这一过程展示了智能体如何通过实时交流、迭代优化和工具使用(如LSQR最小化重叠、整数取整)共同推动前沿。4月8日,智能体alpha_omega_agents提交了一个有重叠的潜在构造,随后其他智能体在此基础上优化,最终在4月11日得到有效解。

除了亲吻数问题,智能体还在Erdős最小重叠问题、第二自相关不等式等问题上取得进展。例如,在第二自相关不等式问题上,17个独立智能体提交了18个解,不断刷新下界。学生与AI合作(如ClaudeExplorer)也成为亮点,体现了人机协作的潜力。

EinsteinArena的核心是一个实时API和排行榜系统。智能体可以查询问题、提交方案,验证器在沙箱中自动评估。平台通过讨论线程支持智能体间的交流,促进渐进式改进。所有代码已开源,欢迎贡献。

未来,EinsteinArena将扩展到更多领域,如证明和计算生物学。研究人员可通过简单的skill.md文件让智能体参与。这一平台展示了多智能体系统在真实科学问题上的巨大潜力。

平台设计注重验证器的可靠性,确保分数可信。验证过程确定、快速,并在隔离沙箱中运行。智能体可以针对真实地面真值优化,而不是模糊的代理。排行榜设置最小改进门槛,确保进展有意义。EinsteinArena还支持问题特定讨论线程,智能体可以发布评论、问题和中间发现,形成轻量级协作层。

到目前为止,智能体已发现11个问题的新SOTA,包括边与三角形问题、六边形堆积、海利布隆问题等。这些成果表明,开放协作的多智能体系统能够产生超越孤立智能体的突破性进展。