Fable 5與Mythos Preview的新競爭者:Sakana的Fugu Ultra模型
Sakana AI釋出了Fugu Ultra,一個透過自主模型編排實現前沿效能的多智慧體系統。該模型在工程、科學和推理基準測試中與Anthropic的Fable 5和Mythos Preview並駕齊驅,同時避免了單供應商依賴和出口管制風險。Fugu本身是一個語言模型,能夠動態編排包括自身在內的多種模型,以處理複雜多步任務。提供Fugu和Fugu Ultra兩個版本,分別最佳化日常使用和最大答案質量。早期使用者反饋在程式碼審查、安全分析和自動化研究等場景表現出色。
Sakana AI今日正式釋出了其最新產品Sakana Fugu,這是一個將多智慧體編排系統封裝為單一基礎模型的創新產品。其中,旗艦版本Fugu Ultra在業界最嚴格的工程、科學和推理基準測試中,與Anthropic的Fable 5和Mythos Preview等領先模型並駕齊驅,同時完全規避了出口管制帶來的風險。
Sakana Fugu的核心是一個經過專門訓練的語言模型,它能夠智慧地呼叫一個智慧體池中的各種大語言模型(包括自身遞迴呼叫),以動態編排全球最優模型來解決複雜且多步驟的任務。使用者只需透過一個統一的API介面傳送請求,Fugu便會自主決策如何處理:直接解決簡單問題,或在需要時組建並協調專家模型團隊,從而將多智慧體系統的複雜性完全隱藏在幕後。
此次釋出包含兩個版本:Fugu和Fugu Ultra。Fugu版本在效能與低延遲之間取得了平衡,非常適合日常編碼、程式碼審查及互動式服務等場景。Fugu Ultra則針對高難度、多步驟問題進行了深度最佳化,透過協調更深層次的專家智慧體池,提供最高質量的答案。早期使用者已將其應用於人工智慧研究、論文復現、網路安全分析以及文獻和專利調查等任務。
值得強調的是,Sakana AI將集體智慧視為應對當前AI領域單供應商依賴風險的關鍵策略。近期出口管制事件表明,對單一公司API的依賴可能隨時因政策變化而中斷。Fugu的動態編排能力使其能夠自動繞過中斷,並透過持續整合新型高效模型(包括Sakana AI自研模型和開源模型)來自然演進,為AI主權提供切實可行的彈性解決方案。
早期使用者反饋印證了Fugu的實際價值。一位軟體工程師指出,在程式碼審查中Fugu Ultra的表現顯著優於其他工具,能夠發現更多漏洞;一位企業平臺公司高管稱讚其長時間會話中的人物穩定性;一位網路安全工程師則成功利用Fugu全自動完成了端到端安全評估。這些案例表明,在多步驟、開放性任務中,Fugu的編排能力帶來了超越單次模型呼叫的持續進步。
Sakana Fugu現已正式開放使用,提供訂閱制與按需付費兩種方案。未來,Sakana AI計劃進一步擴充套件專家智慧體池,加強長週期任務協調能力,並賦予使用者更多控制權。