AI News HubLIVE
站内改写2 分钟阅读

Sakana Fugu:将多智能体系统作为模型

Sakana AI 的 Fugu 是一种多智能体系统模型,它在内部协调多个专家代理,对外表现为单一模型。开发者通过一个 API 调用即可触发直接回答、专家委派、中间验证和最终合成,简化了多智能体工作流的复杂性。

来源Analytics Vidhya作者: Harsh Mishra

Sakana AI 推出的 Fugu 是一款将多智能体编排封装为模型级能力的商业产品。从外部看,它就像一个普通的语言模型,但内部却协调着多个专家代理。开发者只需向一个 API 发送提示,Fugu 便会自动处理代理选择、角色分配、协调、验证和最终响应,从而将复杂的编排逻辑隐藏在标准的 LLM 接口背后。这避免了手动使用 LangGraph、AutoGen 或 CrewAI 等框架构建规划者、编码者、审查者、研究者或监督者代理的繁琐工作,减少了管理提示、路由、重试、内存、状态、监控和故障恢复的需求。

Fugu 的命名源自日语中的“鱼”,寓意集体智能,正如鱼群可以作为一个协调系统行动,多个代理协调在一个接口之后。当前生产级 AI 系统通常分为三种模式:单模型提示、工具增强型 LLM 应用和手动设计的多智能体工作流。单模型提示简单但复杂任务易失败;工具增强型 LLM 提升了实用性但模型仍作为核心推理引擎;多智能体工作流通过分工提高可靠性,但构建难度大,团队需解决代理任务分配、通信、停止条件、中间输出验证、成本与延迟控制、故障恢复及合规限制等问题。Fugu 通过将多智能体编排转化为模型级能力来简化这一过程。

Fugu 提供两种型号:Fugu 和 Fugu Ultra。Fugu 适用于日常编码、聊天、审查和交互式工作流,平衡质量与延迟;Fugu Ultra 则针对高质量答案优化,协调更深层的专家代理池,适用于论文复现、数据科学工作流、网络安全分析、文献综述、专利调查、深度技术研究和复杂代码审查等高难度任务。Fugu 可根据任务动态路由到最佳模型,并允许用户选择退出特定代理以满足数据、隐私、合规或组织要求。Fugu Ultra 则使用固定全代理池,根据问题路由一至三个代理。

Fugu 的内部架构可以理解为一个托管编排层包裹在模型 API 中。核心组件包括:API 网关(支持 OpenAI 兼容端点,可复用现有 SDK)、编排模型(核心智能层,决定任务处理方式)、代理池(具有不同专长的底层模型)、动态路由(避免硬编码工作流)、委派与通信(将任务分解为子任务并发送指令)、验证(用于困难任务的多代理验证)和合成(将最终答案作为单一响应返回)。

定价方面,Fugu 提供按使用付费和订阅计划。按使用付费模式下,当激活多个代理时费用不会叠加,而是根据最高层模型收取统一费率。Fugu Ultra 的固定令牌定价为:输入每百万令牌 5 美元(上下文超 272K 时为 10 美元),输出每百万令牌 30 美元(超 272K 时为 45 美元),缓存输入每百万令牌 0.50 美元(超 272K 时为 1 美元)。订阅计划包含标准(20 美元/月)、Pro(100 美元/月)和 Max(200 美元/月)三档,每档均包含 Fugu 和 Fugu Ultra 的使用额度。

基准测试表明,Fugu 和 Fugu Ultra 在编码、推理、科学、智能体任务和长上下文推理方面表现出色,但 Fugu Ultra 并非在所有任务上都优于 Fugu。开发者应针对自身工作负载进行基准测试。实际使用中,建议交互式任务使用 Fugu,复杂高价值任务使用 Fugu Ultra,延迟或成本敏感时回退到 Fugu。尽管 Fugu 隐藏了编排复杂性,但底层系统仍会产生额外工作,团队需监控令牌总数、编排令牌、任务类型延迟和质量。