AI News HubLIVE
站內改寫2 分鐘閱讀

Sakana AI 發佈 Fugu,一款聲稱達到 Fable 5 性能的編排模型

Sakana AI 今日正式推出 Fugu 和 Fugu Ultra,這是一種新型語言模型,專門用於跨多個前沿模型(GPT-5.5、Gemini 3.5 Flash、Claude Opus 4.8)進行任務委派、代理間通信和結果聚合。Fugu Ultra 在標準推理和編碼評估中聲稱與 Anthropic 的 Fable 5 和 Mythos Preview 相媲美。該架構基於 Sakana 在 ICLR 2026 上的研究,將跨模型委派視為可訓練的目標,而非硬編碼的路由器。其發佈時機關鍵:Anthropic 的 Fable 5 自 6 月 12 日起因美國出口管制而無法全球訪問,且今天是該模型在標準訂閲計劃中的最後一天。Fugu 通過編排不受出口限制的模型,向不受地域限制的用户提供類似 Fable 5 的輸出。此外,該架構主張編排中端模型可以替代單一前沿模型,在成本結構、提供商彈性和地緣政治合規方面具有疊加優勢。

來源Hacker News AI作者: polskibus

Sakana AI 今日正式推出 Fugu 和 Fugu Ultra 作為通用可用產品。其核心理念與眾不同:Fugu 本身是一個語言模型,專門訓練用於委派任務、管理代理間通信,並通過單一統一 API 彙總來自一組前沿模型(目前為 GPT-5.5、Gemini 3.5 Flash 和 Claude Opus 4.8)的結果。高規格版本 Fugu Ultra 聲稱在標準推理和編碼評估中與 Anthropic 的 Fable 5 和 Mythos Preview 達到基準一致。該架構將 Sakana 在 ICLR 2026 上關於學習模型編排的研究(Trinity 和 The Conductor 論文)正式化,將跨模型委派視為可訓練的目標,而非手工編碼的路由器。

發佈時機具有針對性。Anthropic 的 Fable 5 和 Mythos 5 自 6 月 12 日起根據美國商務部出口管制指令而無法全球訪問,且今天是這些模型在 Anthropic 標準訂閲計劃中的最後一天,之後將轉為使用量付費。前沿能力與開發者合法訪問能力之間的差距很少如此之大,而 Fugu 直接瞄準這一差距:通過編排不受出口限制的模型,它為不受地域限制的用户羣提供 Fable 5 級別的輸出。除了直接的套利,架構聲明是更持久的重點:編排中端模型可以替代單一前沿模型,在成本結構、提供商彈性和地緣政治合規方面具有疊加優勢。這一論點對於任何依賴無法依賴單一前沿 API 的本地或設備基礎設施的組織都直接相關。

需要關注三件事。首先,Fugu 的基準測試結果能否在代理和長週期任務上經受獨立復現:歷史上,編排系統在針對單模型輸出的評估中表現過好,但在需要多步驟間緊密狀態一致性的任務上表現掙扎。其次,延遲和成本:跨提供商鏈式調用 API 會帶來生產環境中重要的往返開銷,為完成一個模型的工作而支付三個模型的經濟性需要在規模上仔細審視。第三,Anthropic 的時間表:Fable 5 的迴歸將急劇壓縮 Fugu 的定位,但編排架構並非一招鮮。Sakana 的可信度是真實的,聯合創始人 Llion Jones 是原始 Transformer 論文的八位合著者之一,該實驗室在 ICLR 上的記錄使其不僅僅是噱頭。更廣泛的觀察:如果 Fugu Ultra 的聲明成立,那麼將編排視為二流後備選項的時代就結束了。

其他值得注意的新聞:微軟 CEO Satya Nadella 發表文章警告 AI 集中化無法經受政治審查,並呼籲企業構建私有學習循環而非依賴前沿 API。SpaceX 以 600 億美元股票收購了 Anysphere(Cursor AI 編輯器製造商),這是除 Musk 為 xAI 自交易外最大的 VC 支持初創公司收購案。Anthropic 的 Fable 5 免費試用今日結束,同時 Anthropic 推出生物識別身份驗證,可能用於僅限美國公民的恢復訪問。