2026-06-23 20:30 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-23 22:06 UTC+8

Sakana Fugu：將多智能體系統作為模型

Sakana AI 的 Fugu 是一種多智能體系統模型，它在內部協調多個專家代理，對外表現為單一模型。開發者通過一個 API 調用即可觸發直接回答、專家委派、中間驗證和最終合成，簡化了多智能體工作流的複雜性。

來源Analytics Vidhya作者: Harsh Mishra

Sakana AI 推出的 Fugu 是一款將多智能體編排封裝為模型級能力的商業產品。從外部看，它就像一個普通的語言模型，但內部卻協調着多個專家代理。開發者只需向一個 API 發送提示，Fugu 便會自動處理代理選擇、角色分配、協調、驗證和最終響應，從而將複雜的編排邏輯隱藏在標準的 LLM 接口背後。這避免了手動使用 LangGraph、AutoGen 或 CrewAI 等框架構建規劃者、編碼者、審查者、研究者或監督者代理的繁瑣工作，減少了管理提示、路由、重試、內存、狀態、監控和故障恢復的需求。

Fugu 的命名源自日語中的“魚”，寓意集體智能，正如魚羣可以作為一個協調系統行動，多個代理協調在一個接口之後。當前生產級 AI 系統通常分為三種模式：單模型提示、工具增強型 LLM 應用和手動設計的多智能體工作流。單模型提示簡單但複雜任務易失敗；工具增強型 LLM 提升了實用性但模型仍作為核心推理引擎；多智能體工作流通過分工提高可靠性，但構建難度大，團隊需解決代理任務分配、通信、停止條件、中間輸出驗證、成本與延遲控制、故障恢復及合規限制等問題。Fugu 通過將多智能體編排轉化為模型級能力來簡化這一過程。

Fugu 提供兩種型號：Fugu 和 Fugu Ultra。Fugu 適用於日常編碼、聊天、審查和交互式工作流，平衡質量與延遲；Fugu Ultra 則針對高質量答案優化，協調更深層的專家代理池，適用於論文復現、數據科學工作流、網絡安全分析、文獻綜述、專利調查、深度技術研究和複雜代碼審查等高難度任務。Fugu 可根據任務動態路由到最佳模型，並允許用户選擇退出特定代理以滿足數據、隱私、合規或組織要求。Fugu Ultra 則使用固定全代理池，根據問題路由一至三個代理。

Fugu 的內部架構可以理解為一個託管編排層包裹在模型 API 中。核心組件包括：API 網關（支持 OpenAI 兼容端點，可複用現有 SDK）、編排模型（核心智能層，決定任務處理方式）、代理池（具有不同專長的底層模型）、動態路由（避免硬編碼工作流）、委派與通信（將任務分解為子任務併發送指令）、驗證（用於困難任務的多代理驗證）和合成（將最終答案作為單一響應返回）。

定價方面，Fugu 提供按使用付費和訂閲計劃。按使用付費模式下，當激活多個代理時費用不會疊加，而是根據最高層模型收取統一費率。Fugu Ultra 的固定令牌定價為：輸入每百萬令牌 5 美元（上下文超 272K 時為 10 美元），輸出每百萬令牌 30 美元（超 272K 時為 45 美元），緩存輸入每百萬令牌 0.50 美元（超 272K 時為 1 美元）。訂閲計劃包含標準（20 美元/月）、Pro（100 美元/月）和 Max（200 美元/月）三檔，每檔均包含 Fugu 和 Fugu Ultra 的使用額度。

基準測試表明，Fugu 和 Fugu Ultra 在編碼、推理、科學、智能體任務和長上下文推理方面表現出色，但 Fugu Ultra 並非在所有任務上都優於 Fugu。開發者應針對自身工作負載進行基準測試。實際使用中，建議交互式任務使用 Fugu，複雜高價值任務使用 Fugu Ultra，延遲或成本敏感時回退到 Fugu。儘管 Fugu 隱藏了編排複雜性，但底層系統仍會產生額外工作，團隊需監控令牌總數、編排令牌、任務類型延遲和質量。