本周AI动态:多供应商战略
在本期节目中,Andreas Welsch和Matt Palmer讨论了美国对前沿AI模型出口限制的影响、委托给AI代理的挑战,以及Sakana AI的新Fugu系统作为多供应商编排解决方案。他们强调了采用多供应商战略以避免基础设施依赖的必要性。
本期的《本周AI动态》在大多数团队习以为常的AI基础设施突然变得不那么稳定的背景下展开。Andreas Welsch和Matt Palmer一起探讨了美国政府针对前沿AI模型的出口限制对从业者的实际意义,为何将任务委托给代理并不像听起来那么轻松,以及Sakana AI的新Fugu系统作为替代架构提供了什么。
当API消失时
Andreas和Matt首先跟进Fable 5和Mythos传奇的最新进展。美国政府现已放宽对Anthropic的Fable 5和Mythos Preview的限制,将其限制在100家精心挑选的美国组织。OpenAI随后对GPT-5.6实施了类似限制,将早期访问限制在大约20个组织。对于大多数从业者来说,这些模型突然消失了。
Andreas指出了许多欧洲技术领导者已经在思考的问题:出口限制可能反映了政策担忧,但实际上这是一个基础设施故事。如果你的技术栈依赖于一个可能在没有警告的情况下变得不可用的前沿模型,那么你已经将硬依赖构建到你的架构中,而不是一个供应商关系。
Matt从构建者的角度提出了一个补充观点。任何在限制生效前花时间使用Fable 5的人都开始感受到它与其他可用选项之间的能力差距。当竞争对手拥有访问权限而你却没有时,这种差距就是一种商业风险。
这里的讨论落在了O'Reilly一直在关注的领域:组织应该牢记的问题是,如何以足够的灵活性进行构建,以便在情况变化时能够在模型之间路由。这意味着将多供应商战略视为一个基本的架构要求,就像团队对待数据库可移植性或云提供商的独立性一样。Anthropic表示希望访问限制能迅速发展。这可能是真的……但也可能不是。假设它会发生似乎风险更大。
委托陷阱
随着代理开发的普及,我们越来越多地听到关于认知疲劳的消息。随着开发者将更多工作委托给编码代理,他们报告了更高的疲惫度。上周,Andreas指出,另一篇文章流传开来,突出显示了更多工程师从孩子的足球赛到床上全天候检查代理的故事。更多的代理运行意味着更多的会话需要监控,更多的审批需要给出,更多的半成品工作需要在早上审查。“它在你睡觉时运行”的承诺变成类似于同时管理多个工作流的轮班。
Matt指出:
我认为每个人现在都在某种程度上管理一群代理,或者只是协调这些代理之间的工作流。有时候感觉就像管理一个中等规模的团队。你一直发送消息,检查事情是否完成。编写代码曾经是一项非常放松的活动——你坐下,喝着咖啡,听着爵士乐,放松下来,专注于一项任务——现在那种专注感似乎不再存在。
Andreas将这与哈佛商业评论今年早些时候的一项研究联系起来,该研究跟踪了一家200人的软件公司:随着AI工具变得更有能力,人们开始承担以前属于相邻角色的工作。产品经理在制作原型。开发人员在做设计工作。这些工具扩展了可能的感觉,而可能的感觉变成了必要的感觉,这意味着更多的工作,而不是更少。
Andreas还借鉴了自己从个人贡献者到企业领导层的背景,在那里委托是一种有框架的正式技能:任务是什么?目标是什么?应该使用什么数据?好的输出是什么样子?需要多长时间?今天大多数使用AI的专业人士在没有培训的情况下进行委托,即兴制定委托协议。
这是一个行业的工具投资远远领先于使工具可用的组织技能投资的领域。更有能力的代理不会自动减轻负担;它们以更难看到和管理的方式重新分配负担。能够长期良好实践的从业者是那些弄清楚如何清晰设定范围、高效检查输出并保护深度协作仍需要的专注工作时间的人。
一次API调用,多个模型
这一集的技术核心是Matt对Sakana Fugu的讲解,这是一种来自东京研究实验室Sakana AI的新型模型/多代理系统。Fugu是一个经过训练的协调模型,它将你的查询路由到一组前沿模型,组建一个专家团队,并返回综合结果,全部通过一个与OpenAI兼容的端点。多代理编排完全发生在那个单一API调用之后。
Matt逐步讲解了架构。查询到达一个轻量级协调模型,该模型分配角色。一个模型思考最佳方法,另一个执行实现工作,第三个充当验证者。系统可以是递归的,协调者将一部分工作以更小的规模通过相同的过程分配回去。Sakana称之为学习编排,这一概念由两篇论文支持:“TRINITY: An Evolved LLM Coordinator”和“Learning to Orchestrate Agents in Natural Language with the Conductor”,探讨了系统如何学习路由和协调,而不是遵循手工设计的工作流。Matt还展示了如何通过curl将Fugu快速设置为直接API调用(它是OpenAI兼容端点的即插即用替代品)、通过Codex框架(一行安装程序)以及通过OpenRouter的开源OpenCode框架。Sakana声称其新颖的编排方法从现有模型中提取了更好的性能。Fugu的Ultra模型在Terminal-Bench等代理基准测试中与Fable 5得分相当,并且定价与GPT-5.5相同。这些性能声明是否能在更广泛的实际工作负载中成立,将取决于社区,但无论这些基准测试最终如何验证,可移植性论点都成立。
Sakana在美国对Fable 5和Mythos的出口限制生效10天后推出了Fugu,并明确提出了AI主权的概念。由于Fugu编排来自多个提供商的模型,对任何单个模型的限制都不会使系统瘫痪,而且你可以选择特定提供商。对于面临访问不确定性的地区的团队(例如,欧洲目前因监管合规而被锁定),这种架构直接回应了Andreas在节目开始时提出的问题。
高通对Modular的收购,同一周宣布,大约39亿美元,在硬件层面符合相同的模式。Modular的平台允许AI模型在不同的芯片架构上运行,包括NVIDIA、AMD和定制ASIC,而无需开发人员为每个架构重写代码。高通获得了一个硬件无关的抽象层,市场得到了另一个证据,表明可移植性正在成为整个栈的投资优先事项。
接下来是什么
加入我们的下一期《本周AI动态》,于7月6日星期一美国东部时间上午10:00-10:30,Christina Stathopoulos将分析AI的最新发展。
在O'Reilly学习平台上注册参加现场直播。如果您还不是会员,可以免费试用10天。
《本周AI动态》可在YouTube、Spotify、Apple或您获取播客的任何地方收听。