AI News HubLIVE
站内改写2 分钟阅读

用Sakana AI Fugu多智能体模型缓解供应商锁定

日本AI公司Sakana AI推出Fugu,通过多智能体编排来降低企业对单一AI供应商的依赖风险。Fugu提供标准版和Ultra版,后者针对复杂任务,在网络安全、软件开发和自动化研究等领域表现出色。该系统通过可替换的模型池实现服务连续性,解决地缘政治和监管风险。

来源Artificial Intelligence News作者: Ryan Daws

日本人工智能公司Sakana AI发布了Fugu,这是一款旨在通过多智能体编排来降低企业部署中单一供应商依赖风险的解决方案。企业完全依赖单一AI API会面临运营脆弱性,例如最近的出口管制影响了Anthropic的部分模型,表明访问特定基础架构可能因地缘政治决策而突然中断。Fugu通过创建一种编排语言模型,调用一组多样化的模型来完成多步骤任务,从而应对这些风险。

用户通过兼容OpenAI的单一端点访问该系统。Fugu在内部路由查询,决定是直接解析提示还是组建一组专家模型进行深入分析。系统内部处理模型选择、委派、验证和综合,工程团队看到的是一个模型,而背景中的专业模型系统执行实际计算。Fugu的模型池完全可替换,当某个供应商受限制或降级时,系统能动态转移流量,保持服务连续性,这被视为AI主权的弹性架构。

Fugu提供两个部署层级:标准版优先考虑低延迟,适用于日常任务,融入Codex等开发者工具进行实时编码和代码审查;Ultra版针对需要最高准确性的复杂多步骤分析问题,协调更深的专业智能体池,用于学术论文复现、文献调查和专利分析。Sakana AI报告称,Fugu Ultra在科学、工程和推理基准测试中与Fable 5和Mythos Preview等领先封闭模型竞争,同时避免了这些模型带来的供应商集中风险或出口管制风险。

在网络安全领域,近500名早期用户在针对长多步骤计算工作流的测试版中测试了该系统。工程团队部署Fugu Ultra来自动化完整的安全评估周期:人类操作员发出一个范围指令,编排引擎执行整个侦察阶段,成功进行跨站脚本攻击和SQL注入检查以及身份验证审查。一名参与的网络安全工程师证实,模型严格保持在操作参数内,未对目标基础设施发起破坏性行动,最终生成包含验证证据和精确复测步骤的整洁漏洞报告。在软件开发中,Fugu Ultra被集成到主要代码审查流程中,在识别逻辑缺陷和安全漏洞方面持续优于基线模型。报道引述一位软件工程师的话:“Fugu Ultra比GPT-5.5好得多,能发现其他人错过的错误,在别人找到约3个问题时,Fugu能发现20多个。”

数据科学团队几乎以全自动研究模式部署系统。Fugu Ultra成功探索数学假设,执行实验代码运行,解读失败状态并修正自身方法,在长时间内以最少人工干预保持进展。一家企业平台公司的领导层指出,在长时间对话中,Fugu展现出异常强大的角色稳定性,能保持其身份而不像其他模型那样漂移。该高管表示:“原始输出质量与顶级前沿模型相当,但Fugu在长时间会话中表现出异常强大的角色稳定性,这对智能体产品可能比原始基准分数更重要。”

Sakana AI将内部路由逻辑建立在关于学习模型编排的广泛研究上,技术基础源于在ICLR 2026发表的论文中的Trinity和Conductor框架。Fugu通过理解任务何时需要委派或直接解决来处理请求,内部语言模型决定个体智能体之间的通信协议并结构化工最终输出。验证测试涵盖金融时间序列预测、机械设计、物理逻辑测试和视觉解读任务(如解魔方和日语笔迹分析)。Sakana AI计划随着AI软硬件市场成熟而有机扩展系统,持续加入新发布的开源工具和专有模型。Fugu标准版和Ultra版现已向企业客户提供。