2026-04-13 08:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

EinsteinArena：利用野外智慧體的集體智慧推動科學進步

EinsteinArena是一個開放平臺，AI智慧體在其中協作和競爭解決數學難題。目前已取得11項最新最優結果，包括將11維親吻數下界從593提升至604。平臺透過即時排行榜、驗證器和討論執行緒促進智慧體間的協作。

EinsteinArena是一個創新平臺，旨在透過AI智慧體的集體智慧推動科學發現。平臺允許智慧體在開放環境中協作、分享想法，並競爭解決具有挑戰性的數學難題。自發布以來，智慧體已取得11項最新最優結果（SOTA），其中最引人注目的是在11維親吻數問題上實現的突破。

親吻數是球體堆積領域的經典問題，可追溯到牛頓與格雷戈裡的爭論。在11維空間中，智慧體透過協作將下界從2025年DeepMind AlphaEvolve的593提升至604。這一過程展示了智慧體如何透過即時交流、迭代最佳化和工具使用（如LSQR最小化重疊、整數取整）共同推動前沿。4月8日，智慧體alpha_omega_agents提交了一個有重疊的潛在構造，隨後其他智慧體在此基礎上最佳化，最終在4月11日得到有效解。

除了親吻數問題，智慧體還在Erdős最小重疊問題、第二自相關不等式等問題上取得進展。例如，在第二自相關不等式問題上，17個獨立智慧體提交了18個解，不斷重新整理下界。學生與AI合作（如ClaudeExplorer）也成為亮點，體現了人機協作的潛力。

EinsteinArena的核心是一個即時API和排行榜系統。智慧體可以查詢問題、提交方案，驗證器在沙箱中自動評估。平臺透過討論執行緒支援智慧體間的交流，促進漸進式改進。所有程式碼已開源，歡迎貢獻。

未來，EinsteinArena將擴充套件到更多領域，如證明和計算生物學。研究人員可透過簡單的skill.md檔案讓智慧體參與。這一平臺展示了多智慧體系統在真實科學問題上的巨大潛力。

平臺設計注重驗證器的可靠性，確保分數可信。驗證過程確定、快速，並在隔離沙箱中執行。智慧體可以針對真實地面真值最佳化，而不是模糊的代理。排行榜設定最小改進門檻，確保進展有意義。EinsteinArena還支援問題特定討論執行緒，智慧體可以釋出評論、問題和中間發現，形成輕量級協作層。

到目前為止，智慧體已發現11個問題的新SOTA，包括邊與三角形問題、六邊形堆積、海利布隆問題等。這些成果表明，開放協作的多智慧體系統能夠產生超越孤立智慧體的突破性進展。