2026-06-23 20:30 UTC+8站内改写2 分钟阅读更新: 2026-06-23 22:06 UTC+8

Sakana Fugu：将多智能体系统作为模型

Sakana AI 的 Fugu 是一种多智能体系统模型，它在内部协调多个专家代理，对外表现为单一模型。开发者通过一个 API 调用即可触发直接回答、专家委派、中间验证和最终合成，简化了多智能体工作流的复杂性。

来源Analytics Vidhya作者: Harsh Mishra

Sakana AI 推出的 Fugu 是一款将多智能体编排封装为模型级能力的商业产品。从外部看，它就像一个普通的语言模型，但内部却协调着多个专家代理。开发者只需向一个 API 发送提示，Fugu 便会自动处理代理选择、角色分配、协调、验证和最终响应，从而将复杂的编排逻辑隐藏在标准的 LLM 接口背后。这避免了手动使用 LangGraph、AutoGen 或 CrewAI 等框架构建规划者、编码者、审查者、研究者或监督者代理的繁琐工作，减少了管理提示、路由、重试、内存、状态、监控和故障恢复的需求。

Fugu 的命名源自日语中的“鱼”，寓意集体智能，正如鱼群可以作为一个协调系统行动，多个代理协调在一个接口之后。当前生产级 AI 系统通常分为三种模式：单模型提示、工具增强型 LLM 应用和手动设计的多智能体工作流。单模型提示简单但复杂任务易失败；工具增强型 LLM 提升了实用性但模型仍作为核心推理引擎；多智能体工作流通过分工提高可靠性，但构建难度大，团队需解决代理任务分配、通信、停止条件、中间输出验证、成本与延迟控制、故障恢复及合规限制等问题。Fugu 通过将多智能体编排转化为模型级能力来简化这一过程。

Fugu 提供两种型号：Fugu 和 Fugu Ultra。Fugu 适用于日常编码、聊天、审查和交互式工作流，平衡质量与延迟；Fugu Ultra 则针对高质量答案优化，协调更深层的专家代理池，适用于论文复现、数据科学工作流、网络安全分析、文献综述、专利调查、深度技术研究和复杂代码审查等高难度任务。Fugu 可根据任务动态路由到最佳模型，并允许用户选择退出特定代理以满足数据、隐私、合规或组织要求。Fugu Ultra 则使用固定全代理池，根据问题路由一至三个代理。

Fugu 的内部架构可以理解为一个托管编排层包裹在模型 API 中。核心组件包括：API 网关（支持 OpenAI 兼容端点，可复用现有 SDK）、编排模型（核心智能层，决定任务处理方式）、代理池（具有不同专长的底层模型）、动态路由（避免硬编码工作流）、委派与通信（将任务分解为子任务并发送指令）、验证（用于困难任务的多代理验证）和合成（将最终答案作为单一响应返回）。

定价方面，Fugu 提供按使用付费和订阅计划。按使用付费模式下，当激活多个代理时费用不会叠加，而是根据最高层模型收取统一费率。Fugu Ultra 的固定令牌定价为：输入每百万令牌 5 美元（上下文超 272K 时为 10 美元），输出每百万令牌 30 美元（超 272K 时为 45 美元），缓存输入每百万令牌 0.50 美元（超 272K 时为 1 美元）。订阅计划包含标准（20 美元/月）、Pro（100 美元/月）和 Max（200 美元/月）三档，每档均包含 Fugu 和 Fugu Ultra 的使用额度。

基准测试表明，Fugu 和 Fugu Ultra 在编码、推理、科学、智能体任务和长上下文推理方面表现出色，但 Fugu Ultra 并非在所有任务上都优于 Fugu。开发者应针对自身工作负载进行基准测试。实际使用中，建议交互式任务使用 Fugu，复杂高价值任务使用 Fugu Ultra，延迟或成本敏感时回退到 Fugu。尽管 Fugu 隐藏了编排复杂性，但底层系统仍会产生额外工作，团队需监控令牌总数、编排令牌、任务类型延迟和质量。