Fable 5与Mythos Preview的新竞争者:Sakana的Fugu Ultra模型
Sakana AI发布了Fugu Ultra,一个通过自主模型编排实现前沿性能的多智能体系统。该模型在工程、科学和推理基准测试中与Anthropic的Fable 5和Mythos Preview并驾齐驱,同时避免了单供应商依赖和出口管制风险。Fugu本身是一个语言模型,能够动态编排包括自身在内的多种模型,以处理复杂多步任务。提供Fugu和Fugu Ultra两个版本,分别优化日常使用和最大答案质量。早期用户反馈在代码审查、安全分析和自动化研究等场景表现出色。
Sakana AI今日正式发布了其最新产品Sakana Fugu,这是一个将多智能体编排系统封装为单一基础模型的创新产品。其中,旗舰版本Fugu Ultra在业界最严格的工程、科学和推理基准测试中,与Anthropic的Fable 5和Mythos Preview等领先模型并驾齐驱,同时完全规避了出口管制带来的风险。
Sakana Fugu的核心是一个经过专门训练的语言模型,它能够智能地调用一个智能体池中的各种大语言模型(包括自身递归调用),以动态编排全球最优模型来解决复杂且多步骤的任务。用户只需通过一个统一的API接口发送请求,Fugu便会自主决策如何处理:直接解决简单问题,或在需要时组建并协调专家模型团队,从而将多智能体系统的复杂性完全隐藏在幕后。
此次发布包含两个版本:Fugu和Fugu Ultra。Fugu版本在性能与低延迟之间取得了平衡,非常适合日常编码、代码审查及交互式服务等场景。Fugu Ultra则针对高难度、多步骤问题进行了深度优化,通过协调更深层次的专家智能体池,提供最高质量的答案。早期用户已将其应用于人工智能研究、论文复现、网络安全分析以及文献和专利调查等任务。
值得强调的是,Sakana AI将集体智能视为应对当前AI领域单供应商依赖风险的关键策略。近期出口管制事件表明,对单一公司API的依赖可能随时因政策变化而中断。Fugu的动态编排能力使其能够自动绕过中断,并通过持续集成新型高效模型(包括Sakana AI自研模型和开源模型)来自然演进,为AI主权提供切实可行的弹性解决方案。
早期用户反馈印证了Fugu的实际价值。一位软件工程师指出,在代码审查中Fugu Ultra的表现显著优于其他工具,能够发现更多漏洞;一位企业平台公司高管称赞其长时间会话中的人物稳定性;一位网络安全工程师则成功利用Fugu全自动完成了端到端安全评估。这些案例表明,在多步骤、开放性任务中,Fugu的编排能力带来了超越单次模型调用的持续进步。
Sakana Fugu现已正式开放使用,提供订阅制与按需付费两种方案。未来,Sakana AI计划进一步扩展专家智能体池,加强长周期任务协调能力,并赋予用户更多控制权。