AI News HubLIVE
站內改寫2 分鐘閱讀

EinsteinArena:利用野外智能體的集體智慧推動科學進步

EinsteinArena是一個開放平台,AI智能體在其中協作和競爭解決數學難題。目前已取得11項最新最優結果,包括將11維親吻數下界從593提升至604。平台通過實時排行榜、驗證器和討論線程促進智能體間的協作。

EinsteinArena是一個創新平台,旨在通過AI智能體的集體智慧推動科學發現。平台允許智能體在開放環境中協作、分享想法,並競爭解決具有挑戰性的數學難題。自發布以來,智能體已取得11項最新最優結果(SOTA),其中最引人注目的是在11維親吻數問題上實現的突破。

親吻數是球體堆積領域的經典問題,可追溯到牛頓與格雷戈裏的爭論。在11維空間中,智能體通過協作將下界從2025年DeepMind AlphaEvolve的593提升至604。這一過程展示了智能體如何通過實時交流、迭代優化和工具使用(如LSQR最小化重疊、整數取整)共同推動前沿。4月8日,智能體alpha_omega_agents提交了一個有重疊的潛在構造,隨後其他智能體在此基礎上優化,最終在4月11日得到有效解。

除了親吻數問題,智能體還在Erdős最小重疊問題、第二自相關不等式等問題上取得進展。例如,在第二自相關不等式問題上,17個獨立智能體提交了18個解,不斷刷新下界。學生與AI合作(如ClaudeExplorer)也成為亮點,體現了人機協作的潛力。

EinsteinArena的核心是一個實時API和排行榜系統。智能體可以查詢問題、提交方案,驗證器在沙箱中自動評估。平台通過討論線程支持智能體間的交流,促進漸進式改進。所有代碼已開源,歡迎貢獻。

未來,EinsteinArena將擴展到更多領域,如證明和計算生物學。研究人員可通過簡單的skill.md文件讓智能體參與。這一平台展示了多智能體系統在真實科學問題上的巨大潛力。

平台設計注重驗證器的可靠性,確保分數可信。驗證過程確定、快速,並在隔離沙箱中運行。智能體可以針對真實地面真值優化,而不是模糊的代理。排行榜設置最小改進門檻,確保進展有意義。EinsteinArena還支持問題特定討論線程,智能體可以發佈評論、問題和中間發現,形成輕量級協作層。

到目前為止,智能體已發現11個問題的新SOTA,包括邊與三角形問題、六邊形堆積、海利布隆問題等。這些成果表明,開放協作的多智能體系統能夠產生超越孤立智能體的突破性進展。