AI News HubLIVE
站内改写3 分鐘閱讀

模型中立性:為什麼避免AI供應商鎖定至關重要

本文探討模型中立性對AI代理的重要性,並指出各大實驗室正透過工具層鎖定客戶,而開源的抽象層解決方案是關鍵。

我們正經歷另一場軟體構建方式的代際轉變。每二十年左右,軟體構建方式會發生一次變革,迫使每個工程組織重構其工作方式。上一次是從本地部署到雲,而這一次是AI代理,且轉變速度以月計而非年計。

每次轉變都會帶來一系列相同的問題:你依賴誰?你的業務邏輯會被單一供應商鎖定多少?離開的成本有多高?在上一次轉變中,企業大多回答得太晚。由此產生的鎖定效應、不可預測的定價和失敗的遷移賬單,在接下來的十年中支付。

我們即將對模型做出完全相同的事情。我們剛剛經歷了上一次轉變,教訓就在眼前。

雲時代的教訓

作者曾在HashiCorp工作多年,親歷雲時代。他學到的最重要的一點是,關於雲鎖定的表面故事(宕機、定價權、故障轉移)只是爭論的容易部分。更深層的故事是關於超大規模雲提供商實際銷售的是什麼。

他們銷售的是商品。儲存、網路、計算。AWS儲存和GCP儲存在位元組級上是無法區分的產品。由於底層產品是商品,持久留住客戶的唯一方法是在工具層鎖定他們。AWS的CloudFormation、Azure的ARM模板、GCP的Vertex——這些工具都沒有任何內在動機去平等支援競爭對手的最佳功能,這樣做只會讓客戶更容易離開。

Terraform存在的全部理由正是這種工具層鎖定是真實存在的、代價高昂且日益惡化,而正確的答案是在上一層提供中立的抽象:切換的權利,以及在不重寫基礎設施的情況下在單個部署中混合使用不同提供商的能力。

這個論點贏了。不是一蹴而就,但它贏了。早期採納中立性的企業能夠抵制超大規模雲提供商的價格,因為離開是可信的,他們也能度過宕機,因為故障轉移並非理論上的。這些都不是單一供應商能夠提供的。

基礎模型實驗室正在使用同樣的策略

現在看看模型領域正在發生的事情。

實驗室在向你銷售令牌。令牌是一種商品,而且越來越如此。前沿模型之間的差距正在縮小,開放權重模型正在快速追趕,每百萬令牌的價格圖表在過去兩年中一直穩步下降。實驗室知道這一點。他們能看到和你一樣的圖表。

因此,他們的下一步行動是在工具層捕獲你,你可以看到他們同時都在這樣做。Claude Agent SDK、OpenAI的Agents API、Vertex AI Agent Builder。它們的形式都一樣。如果他們擁有你的業務邏輯所在的編排層,你就會繼續消耗他們的令牌,即使其他地方存在更好、更便宜或更合適的模型。

他們沒有商業動機去讓自己的工具成為執行競爭對手模型的絕佳體驗。CloudFormation從來沒有理由去同等地配置GCP資源。Claude Agent SDK沒有理由讓呼叫GPT、Gemini或Llama感覺是一等公民。從實驗室的角度看,讓競爭對手的模型在他們的工具中執行良好會損失收入。他們不會這麼做。

工具鎖定將比模型鎖定本身更難解除,因為工具層是你的業務邏輯所在。

為什麼模型中立性比雲端計算中立性更重要

如果教訓相同,那麼對策也相同:一箇中立的工具層。就像Terraform對雲所做的那樣。

模型中立性比雲端計算中立性更重要,原因有三:

首先,變化速度完全不同。你不會月復一月地將應用程式從AWS遷移到GCP。你會在合同續簽時或遇到宕機時才這樣做,也許每幾年一次。但實驗室每個季度甚至每個月都在相互超越。被鎖定在一個提供商上的團隊不僅面臨宕機和定價風險,而且每次出現新突破時都會被排除在外。

其次,模型正在選擇性商品化。實驗室之所以競相爭奪工具層,正是因為在簡單維度上(如基本推理、通用問答和摘要)原始模型差異化正在侵蝕。但它們並非在所有地方都商品化。Anthropic目前是程式設計方面的首選,儘管OpenAI正在縮小差距,而OpenAI在多模態方面領先。排名每隔幾個月就會變化。在實際生產代理中,正確的答案通常是在同一個工作流中使用多個模型,將每個任務路由給當前最擅長該任務的模型。這隻有在不偏袒任何一方的工具層中才可能實現。

第三,開放權重模型是真實的選擇。Llama、Mistral、DeepSeek、Qwen。自託管在可信度上不同於大多數企業過去所說的“執行你自己的私有云”。因此,中立性不僅是防禦性的。它讓你在同一個代理中混合使用封閉和開放模型,根據任務路由到最便宜、最快或最準確的模型,並在更好的模型釋出時立即切換。

此外,模型時代還有一個雲時代不存在的層面。雲端計算中立性是在合同續簽或宕機時才能兌現的。而模型中立性是在單個代理執行期間就可以行使的:在編碼步驟中選擇Claude,在影像步驟中選擇GPT,當某個提供商限速時中途故障轉移,在不需要昂貴模型時降級到更便宜的模型。雲端計算中立性止於合同。代理中立性必須跟隨請求。

中立工具層意味著什麼

一箇中立的工具層包含三個方面:

  • 開源。你可以閱讀每一行程式碼。沒有任何隱藏、靜默捕獲或為了最佳化供應商而損害你的利益。由模型實驗室提供的閉源代理框架不是中立的,無論市場營銷如何聲稱。
  • 開箱即用多模型。同一個工具層,任何後端。GPT、Claude、Gemini、Llama、Mistral、DeepSeek、Qwen,以及你在防火牆後自託管的任何模型。一個代理定義,每個提供商都是一等公民,因為沒有一個提供商擁有抽象層。
  • 配置檔案感知,而非最低公分母。中立性並不意味著要假裝每個模型都是可互換的。每個前沿模型都有自己的個性,具有不同的優勢、提示模式和工具呼叫風格。一個好的中立工具層會暴露模型配置檔案,這樣你就可以利用每個模型的優點,而不被任何一個模型所俘獲。切換的權利,而不是扁平化的要求。

這就是我們用Deep Agents構建的,也是LangChain一直以來的核心。它是開放的、多模型的、配置檔案感知的。一個旨在超越任何單個模型提供商的工具層。

我們以前做過

超大規模雲提供商銷售商品並在工具層鎖定你。實驗室正在銷售商品並試圖在工具層鎖定你。Terraform透過成為上一級的中立層贏得了雲時代。一箇中立、開放的工具層是模型時代的等價答案。

不同的是,這次轉變比上一次快一個數量級,而錯誤成本也會以數量級增長。