AI News HubLIVE
站内改写3 分钟阅读

模型中立性:为什么避免AI供应商锁定至关重要

本文探讨模型中立性对AI代理的重要性,并指出各大实验室正通过工具层锁定客户,而开源的抽象层解决方案是关键。

我们正经历另一场软件构建方式的代际转变。每二十年左右,软件构建方式会发生一次变革,迫使每个工程组织重构其工作方式。上一次是从本地部署到云,而这一次是AI代理,且转变速度以月计而非年计。

每次转变都会带来一系列相同的问题:你依赖谁?你的业务逻辑会被单一供应商锁定多少?离开的成本有多高?在上一次转变中,企业大多回答得太晚。由此产生的锁定效应、不可预测的定价和失败的迁移账单,在接下来的十年中支付。

我们即将对模型做出完全相同的事情。我们刚刚经历了上一次转变,教训就在眼前。

云时代的教训

作者曾在HashiCorp工作多年,亲历云时代。他学到的最重要的一点是,关于云锁定的表面故事(宕机、定价权、故障转移)只是争论的容易部分。更深层的故事是关于超大规模云提供商实际销售的是什么。

他们销售的是商品。存储、网络、计算。AWS存储和GCP存储在字节级上是无法区分的产品。由于底层产品是商品,持久留住客户的唯一方法是在工具层锁定他们。AWS的CloudFormation、Azure的ARM模板、GCP的Vertex——这些工具都没有任何内在动机去平等支持竞争对手的最佳功能,这样做只会让客户更容易离开。

Terraform存在的全部理由正是这种工具层锁定是真实存在的、代价高昂且日益恶化,而正确的答案是在上一层提供中立的抽象:切换的权利,以及在不重写基础设施的情况下在单个部署中混合使用不同提供商的能力。

这个论点赢了。不是一蹴而就,但它赢了。早期采纳中立性的企业能够抵制超大规模云提供商的价格,因为离开是可信的,他们也能度过宕机,因为故障转移并非理论上的。这些都不是单一供应商能够提供的。

基础模型实验室正在使用同样的策略

现在看看模型领域正在发生的事情。

实验室在向你销售令牌。令牌是一种商品,而且越来越如此。前沿模型之间的差距正在缩小,开放权重模型正在快速追赶,每百万令牌的价格图表在过去两年中一直稳步下降。实验室知道这一点。他们能看到和你一样的图表。

因此,他们的下一步行动是在工具层捕获你,你可以看到他们同时都在这样做。Claude Agent SDK、OpenAI的Agents API、Vertex AI Agent Builder。它们的形式都一样。如果他们拥有你的业务逻辑所在的编排层,你就会继续消耗他们的令牌,即使其他地方存在更好、更便宜或更合适的模型。

他们没有商业动机去让自己的工具成为运行竞争对手模型的绝佳体验。CloudFormation从来没有理由去同等地配置GCP资源。Claude Agent SDK没有理由让调用GPT、Gemini或Llama感觉是一等公民。从实验室的角度看,让竞争对手的模型在他们的工具中运行良好会损失收入。他们不会这么做。

工具锁定将比模型锁定本身更难解除,因为工具层是你的业务逻辑所在。

为什么模型中立性比云计算中立性更重要

如果教训相同,那么对策也相同:一个中立的工具层。就像Terraform对云所做的那样。

模型中立性比云计算中立性更重要,原因有三:

首先,变化速度完全不同。你不会月复一月地将应用程序从AWS迁移到GCP。你会在合同续签时或遇到宕机时才这样做,也许每几年一次。但实验室每个季度甚至每个月都在相互超越。被锁定在一个提供商上的团队不仅面临宕机和定价风险,而且每次出现新突破时都会被排除在外。

其次,模型正在选择性商品化。实验室之所以竞相争夺工具层,正是因为在简单维度上(如基本推理、通用问答和摘要)原始模型差异化正在侵蚀。但它们并非在所有地方都商品化。Anthropic目前是编程方面的首选,尽管OpenAI正在缩小差距,而OpenAI在多模态方面领先。排名每隔几个月就会变化。在实际生产代理中,正确的答案通常是在同一个工作流中使用多个模型,将每个任务路由给当前最擅长该任务的模型。这只有在不偏袒任何一方的工具层中才可能实现。

第三,开放权重模型是真实的选择。Llama、Mistral、DeepSeek、Qwen。自托管在可信度上不同于大多数企业过去所说的“运行你自己的私有云”。因此,中立性不仅是防御性的。它让你在同一个代理中混合使用封闭和开放模型,根据任务路由到最便宜、最快或最准确的模型,并在更好的模型发布时立即切换。

此外,模型时代还有一个云时代不存在的层面。云计算中立性是在合同续签或宕机时才能兑现的。而模型中立性是在单个代理运行期间就可以行使的:在编码步骤中选择Claude,在图像步骤中选择GPT,当某个提供商限速时中途故障转移,在不需要昂贵模型时降级到更便宜的模型。云计算中立性止于合同。代理中立性必须跟随请求。

中立工具层意味着什么

一个中立的工具层包含三个方面:

  • 开源。你可以阅读每一行代码。没有任何隐藏、静默捕获或为了优化供应商而损害你的利益。由模型实验室提供的闭源代理框架不是中立的,无论市场营销如何声称。
  • 开箱即用多模型。同一个工具层,任何后端。GPT、Claude、Gemini、Llama、Mistral、DeepSeek、Qwen,以及你在防火墙后自托管的任何模型。一个代理定义,每个提供商都是一等公民,因为没有一个提供商拥有抽象层。
  • 配置文件感知,而非最低公分母。中立性并不意味着要假装每个模型都是可互换的。每个前沿模型都有自己的个性,具有不同的优势、提示模式和工具调用风格。一个好的中立工具层会暴露模型配置文件,这样你就可以利用每个模型的优点,而不被任何一个模型所俘获。切换的权利,而不是扁平化的要求。

这就是我们用Deep Agents构建的,也是LangChain一直以来的核心。它是开放的、多模型的、配置文件感知的。一个旨在超越任何单个模型提供商的工具层。

我们以前做过

超大规模云提供商销售商品并在工具层锁定你。实验室正在销售商品并试图在工具层锁定你。Terraform通过成为上一级的中立层赢得了云时代。一个中立、开放的工具层是模型时代的等价答案。

不同的是,这次转变比上一次快一个数量级,而错误成本也会以数量级增长。