2026-06-30 23:22 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 23:27 UTC+8

OpenAI、Anthropic、Google——6個月內14次定價變動，大多數團隊都忽略了

2026年1月至6月，OpenAI、Anthropic和Google共進行了14次模型定價調整。模型棄用、隱藏令牌類別和靜默功能變更導致實際賬單與標價不符。追蹤每次呼叫的成本至關重要，否則預算會悄然超支。

來源Hacker News AI作者: aitoukhrib

如果你在2026年1月檢查過LLM API的定價，然後選了一個模型並據此預算，之後就沒再關注過，那麼你現在支付的價格可能已經變了。

從1月到6月，OpenAI、Anthropic和Google對其模型系列共進行了14次定價調整。一些價格下降了，一些上漲了，還有一些模型被棄用，由更貴的繼任者取代。而這些變化中，沒有任何一家提供商透過郵件通知你。

沒人談論的變化

OpenAI在2026年第一季度棄用了GPT-4 Turbo。如果你的程式碼仍指向gpt-4-turbo，它會靜默地重定向到GPT-4o。日誌中的名字相同，但價格不同。GPT-4o每令牌的價格比舊Turbo便宜——輸出令牌率從$0.03/M降至$0.01/M。聽起來不錯，但你的提示詞原本針對Turbo最佳化，而GPT-4o在相同提示下生成的輸出令牌多30-40%。因此，每次呼叫的成本實際上升了，儘管每令牌價格下降。

Anthropic在2026年5月推出了Claude Sonnet 4，輸入價格為$3.00/M。Claude Sonnet 3.5也是$3.00/M——價格相同？不完全是。Sonnet 4在複雜查詢中預設使用擴充套件思考，思考令牌按輸出速率計費。在Sonnet 3.5上花費$0.04的提示詞，在Sonnet 4上可能花費$0.12，因為不可見的思考開銷。成本翻了三倍，而你的程式碼沒做任何改動。

Google保持了Gemini 2.5 Flash的$0.15/M輸入價格，看起來很划算。但他們增加了一個大多數團隊忽略的上下文長度附加費：超過128K令牌時，費率翻倍至$0.30/M。如果你使用長文件進行RAG，實際成本是定價頁面上標價的兩倍。

為什麼你的賬單與定價頁面不符

定價頁面顯示每令牌費率，但你的賬單反映的是實際發生的情況——兩者之間的差距每月都在擴大。造成差距的原因有三個：

*模型棄用輪盤賭*：當提供商停用模型時，你的API呼叫不會失敗，而是靜默地重定向到繼任者。繼任者可能成本更高、生成更多令牌，或者行為差異導致輸出更長。除非你跟蹤每次呼叫的成本而不僅僅是總支出，否則你不會察覺。

*隱藏令牌類別*：思考令牌、快取令牌、系統提示令牌——兩年前這些還不存在。現在它們各有各的費率。Anthropic對思考令牌收取全額輸出費率，Google對快取令牌提供25%的折扣，但對長上下文收取雙倍費用。標價只是五六個數字中的一個。

*靜默功能變更*：OpenAI的結構化輸出模式、Anthropic的擴充套件思考、Google的程式碼執行——這些功能改變了響應包含的令牌數量。當提供商在新模型版本中預設啟用某個功能時，你的令牌數會在你不知情的情況下發生變化。

誰實際上更貴了？

如果你在2026年1月凍結了程式碼並檢查了6月的賬單，很可能發生以下情況：

如果你使用Claude進行復雜推理（思考令牌開銷）、向Gemini傳送長文件（上下文附加費）、或依賴已棄用模型（被重定向），你將支付更多。
如果你切換到Gemini 2.5 Flash處理簡單任務（確實便宜，$0.15/M），或使用DeepSeek V3（自發布以來價格未變），你將支付更少。

如果你不跟蹤每次呼叫的成本，你就無法知道實際支出。而大多數團隊正是如此。a16z的2026年調查顯示，71%使用LLM API的公司不跟蹤單個呼叫級別的支出。他們只看到月度賬單上的一個專案，然後希望它看起來合理。

問題不在於提供商偷偷摸摸。他們釋出了每一次價格變動。問題在於沒人關注——當你檢查時，三個月的漂移已經打擊了你的預算。

如果你的AI賬單本月讓你吃驚，你並不孤單。Tokonomics按模型、功能和成本跟蹤每一次API呼叫，並在發票到達之前發出警報。

定價資料截至2026年6月28日。請檢視提供商定價頁面瞭解最新費率。