Sakana AI 发布 Fugu,一款声称达到 Fable 5 性能的编排模型
Sakana AI 今日正式推出 Fugu 和 Fugu Ultra,这是一种新型语言模型,专门用于跨多个前沿模型(GPT-5.5、Gemini 3.5 Flash、Claude Opus 4.8)进行任务委派、代理间通信和结果聚合。Fugu Ultra 在标准推理和编码评估中声称与 Anthropic 的 Fable 5 和 Mythos Preview 相媲美。该架构基于 Sakana 在 ICLR 2026 上的研究,将跨模型委派视为可训练的目标,而非硬编码的路由器。其发布时机关键:Anthropic 的 Fable 5 自 6 月 12 日起因美国出口管制而无法全球访问,且今天是该模型在标准订阅计划中的最后一天。Fugu 通过编排不受出口限制的模型,向不受地域限制的用户提供类似 Fable 5 的输出。此外,该架构主张编排中端模型可以替代单一前沿模型,在成本结构、提供商弹性和地缘政治合规方面具有叠加优势。
Sakana AI 今日正式推出 Fugu 和 Fugu Ultra 作为通用可用产品。其核心理念与众不同:Fugu 本身是一个语言模型,专门训练用于委派任务、管理代理间通信,并通过单一统一 API 汇总来自一组前沿模型(目前为 GPT-5.5、Gemini 3.5 Flash 和 Claude Opus 4.8)的结果。高规格版本 Fugu Ultra 声称在标准推理和编码评估中与 Anthropic 的 Fable 5 和 Mythos Preview 达到基准一致。该架构将 Sakana 在 ICLR 2026 上关于学习模型编排的研究(Trinity 和 The Conductor 论文)正式化,将跨模型委派视为可训练的目标,而非手工编码的路由器。
发布时机具有针对性。Anthropic 的 Fable 5 和 Mythos 5 自 6 月 12 日起根据美国商务部出口管制指令而无法全球访问,且今天是这些模型在 Anthropic 标准订阅计划中的最后一天,之后将转为使用量付费。前沿能力与开发者合法访问能力之间的差距很少如此之大,而 Fugu 直接瞄准这一差距:通过编排不受出口限制的模型,它为不受地域限制的用户群提供 Fable 5 级别的输出。除了直接的套利,架构声明是更持久的重点:编排中端模型可以替代单一前沿模型,在成本结构、提供商弹性和地缘政治合规方面具有叠加优势。这一论点对于任何依赖无法依赖单一前沿 API 的本地或设备基础设施的组织都直接相关。
需要关注三件事。首先,Fugu 的基准测试结果能否在代理和长周期任务上经受独立复现:历史上,编排系统在针对单模型输出的评估中表现过好,但在需要多步骤间紧密状态一致性的任务上表现挣扎。其次,延迟和成本:跨提供商链式调用 API 会带来生产环境中重要的往返开销,为完成一个模型的工作而支付三个模型的经济性需要在规模上仔细审视。第三,Anthropic 的时间表:Fable 5 的回归将急剧压缩 Fugu 的定位,但编排架构并非一招鲜。Sakana 的可信度是真实的,联合创始人 Llion Jones 是原始 Transformer 论文的八位合著者之一,该实验室在 ICLR 上的记录使其不仅仅是噱头。更广泛的观察:如果 Fugu Ultra 的声明成立,那么将编排视为二流后备选项的时代就结束了。
其他值得注意的新闻:微软 CEO Satya Nadella 发表文章警告 AI 集中化无法经受政治审查,并呼吁企业构建私有学习循环而非依赖前沿 API。SpaceX 以 600 亿美元股票收购了 Anysphere(Cursor AI 编辑器制造商),这是除 Musk 为 xAI 自交易外最大的 VC 支持初创公司收购案。Anthropic 的 Fable 5 免费试用今日结束,同时 Anthropic 推出生物识别身份验证,可能用于仅限美国公民的恢复访问。