用Sakana AI Fugu多智慧體模型緩解供應商鎖定
日本AI公司Sakana AI推出Fugu,透過多智慧體編排來降低企業對單一AI供應商的依賴風險。Fugu提供標準版和Ultra版,後者針對複雜任務,在網路安全、軟體開發和自動化研究等領域表現出色。該系統透過可替換的模型池實現服務連續性,解決地緣政治和監管風險。
日本人工智慧公司Sakana AI釋出了Fugu,這是一款旨在透過多智慧體編排來降低企業部署中單一供應商依賴風險的解決方案。企業完全依賴單一AI API會面臨運營脆弱性,例如最近的出口管制影響了Anthropic的部分模型,表明訪問特定基礎架構可能因地緣政治決策而突然中斷。Fugu透過建立一種編排語言模型,呼叫一組多樣化的模型來完成多步驟任務,從而應對這些風險。
使用者透過相容OpenAI的單一端點訪問該系統。Fugu在內部路由查詢,決定是直接解析提示還是組建一組專家模型進行深入分析。系統內部處理模型選擇、委派、驗證和綜合,工程團隊看到的是一個模型,而背景中的專業模型系統執行實際計算。Fugu的模型池完全可替換,當某個供應商受限制或降級時,系統能動態轉移流量,保持服務連續性,這被視為AI主權的彈性架構。
Fugu提供兩個部署層級:標準版優先考慮低延遲,適用於日常任務,融入Codex等開發者工具進行即時編碼和程式碼審查;Ultra版針對需要最高準確性的複雜多步驟分析問題,協調更深的專業智慧體池,用於學術論文復現、文獻調查和專利分析。Sakana AI報告稱,Fugu Ultra在科學、工程和推理基準測試中與Fable 5和Mythos Preview等領先封閉模型競爭,同時避免了這些模型帶來的供應商集中風險或出口管制風險。
在網路安全領域,近500名早期使用者在針對長多步驟計算工作流的測試版中測試了該系統。工程團隊部署Fugu Ultra來自動化完整的安全評估週期:人類操作員發出一個範圍指令,編排引擎執行整個偵察階段,成功進行跨站指令碼攻擊和SQL隱碼攻擊檢查以及身份驗證審查。一名參與的網路安全工程師證實,模型嚴格保持在操作引數內,未對目標基礎設施發起破壞性行動,最終生成包含驗證證據和精確複測步驟的整潔漏洞報告。在軟體開發中,Fugu Ultra被整合到主要程式碼審查流程中,在識別邏輯缺陷和安全漏洞方面持續優於基線模型。報道引述一位軟體工程師的話:“Fugu Ultra比GPT-5.5好得多,能發現其他人錯過的錯誤,在別人找到約3個問題時,Fugu能發現20多個。”
資料科學團隊幾乎以全自動研究模式部署系統。Fugu Ultra成功探索數學假設,執行實驗程式碼執行,解讀失敗狀態並修正自身方法,在長時間內以最少人工干預保持進展。一家企業平臺公司的領導層指出,在長時間對話中,Fugu展現出異常強大的角色穩定性,能保持其身份而不像其他模型那樣漂移。該高管表示:“原始輸出質量與頂級前沿模型相當,但Fugu在長時間會話中表現出異常強大的角色穩定性,這對智慧體產品可能比原始基準分數更重要。”
Sakana AI將內部路由邏輯建立在關於學習模型編排的廣泛研究上,技術基礎源於在ICLR 2026發表的論文中的Trinity和Conductor框架。Fugu透過理解任務何時需要委派或直接解決來處理請求,內部語言模型決定個體智慧體之間的通訊協議並結構化工最終輸出。驗證測試涵蓋金融時間序列預測、機械設計、物理邏輯測試和視覺解讀任務(如解魔方和日語筆跡分析)。Sakana AI計劃隨著AI軟硬體市場成熟而有機擴充套件系統,持續加入新發布的開源工具和專有模型。Fugu標準版和Ultra版現已向企業客戶提供。