AI News HubLIVE
站內改寫2 分鐘閱讀

Fable 5與Mythos Preview的新競爭者:Sakana的Fugu Ultra模型

Sakana AI發佈了Fugu Ultra,一個通過自主模型編排實現前沿性能的多智能體系統。該模型在工程、科學和推理基準測試中與Anthropic的Fable 5和Mythos Preview並駕齊驅,同時避免了單供應商依賴和出口管制風險。Fugu本身是一個語言模型,能夠動態編排包括自身在內的多種模型,以處理複雜多步任務。提供Fugu和Fugu Ultra兩個版本,分別優化日常使用和最大答案質量。早期用户反饋在代碼審查、安全分析和自動化研究等場景表現出色。

來源Hacker News AI作者: giwook

Sakana AI今日正式發佈了其最新產品Sakana Fugu,這是一個將多智能體編排系統封裝為單一基礎模型的創新產品。其中,旗艦版本Fugu Ultra在業界最嚴格的工程、科學和推理基準測試中,與Anthropic的Fable 5和Mythos Preview等領先模型並駕齊驅,同時完全規避了出口管制帶來的風險。

Sakana Fugu的核心是一個經過專門訓練的語言模型,它能夠智能地調用一個智能體池中的各種大語言模型(包括自身遞歸調用),以動態編排全球最優模型來解決複雜且多步驟的任務。用户只需通過一個統一的API接口發送請求,Fugu便會自主決策如何處理:直接解決簡單問題,或在需要時組建並協調專家模型團隊,從而將多智能體系統的複雜性完全隱藏在幕後。

此次發佈包含兩個版本:Fugu和Fugu Ultra。Fugu版本在性能與低延遲之間取得了平衡,非常適合日常編碼、代碼審查及交互式服務等場景。Fugu Ultra則針對高難度、多步驟問題進行了深度優化,通過協調更深層次的專家智能體池,提供最高質量的答案。早期用户已將其應用於人工智能研究、論文復現、網絡安全分析以及文獻和專利調查等任務。

值得強調的是,Sakana AI將集體智能視為應對當前AI領域單供應商依賴風險的關鍵策略。近期出口管制事件表明,對單一公司API的依賴可能隨時因政策變化而中斷。Fugu的動態編排能力使其能夠自動繞過中斷,並通過持續集成新型高效模型(包括Sakana AI自研模型和開源模型)來自然演進,為AI主權提供切實可行的彈性解決方案。

早期用户反饋印證了Fugu的實際價值。一位軟件工程師指出,在代碼審查中Fugu Ultra的表現顯著優於其他工具,能夠發現更多漏洞;一位企業平台公司高管稱讚其長時間會話中的人物穩定性;一位網絡安全工程師則成功利用Fugu全自動完成了端到端安全評估。這些案例表明,在多步驟、開放性任務中,Fugu的編排能力帶來了超越單次模型調用的持續進步。

Sakana Fugu現已正式開放使用,提供訂閲制與按需付費兩種方案。未來,Sakana AI計劃進一步擴展專家智能體池,加強長週期任務協調能力,並賦予用户更多控制權。