AI News HubLIVE
站內改寫2 分鐘閱讀

OpenAI、Anthropic、Google——6個月內14次定價變動,大多數團隊都忽略了

2026年1月至6月,OpenAI、Anthropic和Google共進行了14次模型定價調整。模型棄用、隱藏令牌類別和靜默功能變更導致實際賬單與標價不符。追蹤每次呼叫的成本至關重要,否則預算會悄然超支。

來源Hacker News AI作者: aitoukhrib

如果你在2026年1月檢查過LLM API的定價,然後選了一個模型並據此預算,之後就沒再關注過,那麼你現在支付的價格可能已經變了。

從1月到6月,OpenAI、Anthropic和Google對其模型系列共進行了14次定價調整。一些價格下降了,一些上漲了,還有一些模型被棄用,由更貴的繼任者取代。而這些變化中,沒有任何一家提供商透過郵件通知你。

沒人談論的變化

OpenAI在2026年第一季度棄用了GPT-4 Turbo。如果你的程式碼仍指向gpt-4-turbo,它會靜默地重定向到GPT-4o。日誌中的名字相同,但價格不同。GPT-4o每令牌的價格比舊Turbo便宜——輸出令牌率從$0.03/M降至$0.01/M。聽起來不錯,但你的提示詞原本針對Turbo最佳化,而GPT-4o在相同提示下生成的輸出令牌多30-40%。因此,每次呼叫的成本實際上升了,儘管每令牌價格下降。

Anthropic在2026年5月推出了Claude Sonnet 4,輸入價格為$3.00/M。Claude Sonnet 3.5也是$3.00/M——價格相同?不完全是。Sonnet 4在複雜查詢中預設使用擴充套件思考,思考令牌按輸出速率計費。在Sonnet 3.5上花費$0.04的提示詞,在Sonnet 4上可能花費$0.12,因為不可見的思考開銷。成本翻了三倍,而你的程式碼沒做任何改動。

Google保持了Gemini 2.5 Flash的$0.15/M輸入價格,看起來很划算。但他們增加了一個大多數團隊忽略的上下文長度附加費:超過128K令牌時,費率翻倍至$0.30/M。如果你使用長文件進行RAG,實際成本是定價頁面上標價的兩倍。

為什麼你的賬單與定價頁面不符

定價頁面顯示每令牌費率,但你的賬單反映的是實際發生的情況——兩者之間的差距每月都在擴大。造成差距的原因有三個:

*模型棄用輪盤賭*:當提供商停用模型時,你的API呼叫不會失敗,而是靜默地重定向到繼任者。繼任者可能成本更高、生成更多令牌,或者行為差異導致輸出更長。除非你跟蹤每次呼叫的成本而不僅僅是總支出,否則你不會察覺。

*隱藏令牌類別*:思考令牌、快取令牌、系統提示令牌——兩年前這些還不存在。現在它們各有各的費率。Anthropic對思考令牌收取全額輸出費率,Google對快取令牌提供25%的折扣,但對長上下文收取雙倍費用。標價只是五六個數字中的一個。

*靜默功能變更*:OpenAI的結構化輸出模式、Anthropic的擴充套件思考、Google的程式碼執行——這些功能改變了響應包含的令牌數量。當提供商在新模型版本中預設啟用某個功能時,你的令牌數會在你不知情的情況下發生變化。

誰實際上更貴了?

如果你在2026年1月凍結了程式碼並檢查了6月的賬單,很可能發生以下情況:

  • 如果你使用Claude進行復雜推理(思考令牌開銷)、向Gemini傳送長文件(上下文附加費)、或依賴已棄用模型(被重定向),你將支付更多。
  • 如果你切換到Gemini 2.5 Flash處理簡單任務(確實便宜,$0.15/M),或使用DeepSeek V3(自發布以來價格未變),你將支付更少。

如果你不跟蹤每次呼叫的成本,你就無法知道實際支出。而大多數團隊正是如此。a16z的2026年調查顯示,71%使用LLM API的公司不跟蹤單個呼叫級別的支出。他們只看到月度賬單上的一個專案,然後希望它看起來合理。

問題不在於提供商偷偷摸摸。他們釋出了每一次價格變動。問題在於沒人關注——當你檢查時,三個月的漂移已經打擊了你的預算。

如果你的AI賬單本月讓你吃驚,你並不孤單。Tokonomics按模型、功能和成本跟蹤每一次API呼叫,並在發票到達之前發出警報。

定價資料截至2026年6月28日。請檢視提供商定價頁面瞭解最新費率。