AI News HubLIVE
站內改寫2 分鐘閱讀

Sakana Fugu:將多智能體系統作為模型

Sakana AI 的 Fugu 是一種多智能體系統模型,它在內部協調多個專家代理,對外表現為單一模型。開發者通過一個 API 調用即可觸發直接回答、專家委派、中間驗證和最終合成,簡化了多智能體工作流的複雜性。

來源Analytics Vidhya作者: Harsh Mishra

Sakana AI 推出的 Fugu 是一款將多智能體編排封裝為模型級能力的商業產品。從外部看,它就像一個普通的語言模型,但內部卻協調着多個專家代理。開發者只需向一個 API 發送提示,Fugu 便會自動處理代理選擇、角色分配、協調、驗證和最終響應,從而將複雜的編排邏輯隱藏在標準的 LLM 接口背後。這避免了手動使用 LangGraph、AutoGen 或 CrewAI 等框架構建規劃者、編碼者、審查者、研究者或監督者代理的繁瑣工作,減少了管理提示、路由、重試、內存、狀態、監控和故障恢復的需求。

Fugu 的命名源自日語中的“魚”,寓意集體智能,正如魚羣可以作為一個協調系統行動,多個代理協調在一個接口之後。當前生產級 AI 系統通常分為三種模式:單模型提示、工具增強型 LLM 應用和手動設計的多智能體工作流。單模型提示簡單但複雜任務易失敗;工具增強型 LLM 提升了實用性但模型仍作為核心推理引擎;多智能體工作流通過分工提高可靠性,但構建難度大,團隊需解決代理任務分配、通信、停止條件、中間輸出驗證、成本與延遲控制、故障恢復及合規限制等問題。Fugu 通過將多智能體編排轉化為模型級能力來簡化這一過程。

Fugu 提供兩種型號:Fugu 和 Fugu Ultra。Fugu 適用於日常編碼、聊天、審查和交互式工作流,平衡質量與延遲;Fugu Ultra 則針對高質量答案優化,協調更深層的專家代理池,適用於論文復現、數據科學工作流、網絡安全分析、文獻綜述、專利調查、深度技術研究和複雜代碼審查等高難度任務。Fugu 可根據任務動態路由到最佳模型,並允許用户選擇退出特定代理以滿足數據、隱私、合規或組織要求。Fugu Ultra 則使用固定全代理池,根據問題路由一至三個代理。

Fugu 的內部架構可以理解為一個託管編排層包裹在模型 API 中。核心組件包括:API 網關(支持 OpenAI 兼容端點,可複用現有 SDK)、編排模型(核心智能層,決定任務處理方式)、代理池(具有不同專長的底層模型)、動態路由(避免硬編碼工作流)、委派與通信(將任務分解為子任務併發送指令)、驗證(用於困難任務的多代理驗證)和合成(將最終答案作為單一響應返回)。

定價方面,Fugu 提供按使用付費和訂閲計劃。按使用付費模式下,當激活多個代理時費用不會疊加,而是根據最高層模型收取統一費率。Fugu Ultra 的固定令牌定價為:輸入每百萬令牌 5 美元(上下文超 272K 時為 10 美元),輸出每百萬令牌 30 美元(超 272K 時為 45 美元),緩存輸入每百萬令牌 0.50 美元(超 272K 時為 1 美元)。訂閲計劃包含標準(20 美元/月)、Pro(100 美元/月)和 Max(200 美元/月)三檔,每檔均包含 Fugu 和 Fugu Ultra 的使用額度。

基準測試表明,Fugu 和 Fugu Ultra 在編碼、推理、科學、智能體任務和長上下文推理方面表現出色,但 Fugu Ultra 並非在所有任務上都優於 Fugu。開發者應針對自身工作負載進行基準測試。實際使用中,建議交互式任務使用 Fugu,複雜高價值任務使用 Fugu Ultra,延遲或成本敏感時回退到 Fugu。儘管 Fugu 隱藏了編排複雜性,但底層系統仍會產生額外工作,團隊需監控令牌總數、編排令牌、任務類型延遲和質量。