OpenAI、Anthropic、Google——6个月内14次定价变动,大多数团队都忽略了
2026年1月至6月,OpenAI、Anthropic和Google共进行了14次模型定价调整。模型弃用、隐藏令牌类别和静默功能变更导致实际账单与标价不符。追踪每次调用的成本至关重要,否则预算会悄然超支。
如果你在2026年1月检查过LLM API的定价,然后选了一个模型并据此预算,之后就没再关注过,那么你现在支付的价格可能已经变了。
从1月到6月,OpenAI、Anthropic和Google对其模型系列共进行了14次定价调整。一些价格下降了,一些上涨了,还有一些模型被弃用,由更贵的继任者取代。而这些变化中,没有任何一家提供商通过邮件通知你。
没人谈论的变化
OpenAI在2026年第一季度弃用了GPT-4 Turbo。如果你的代码仍指向gpt-4-turbo,它会静默地重定向到GPT-4o。日志中的名字相同,但价格不同。GPT-4o每令牌的价格比旧Turbo便宜——输出令牌率从$0.03/M降至$0.01/M。听起来不错,但你的提示词原本针对Turbo优化,而GPT-4o在相同提示下生成的输出令牌多30-40%。因此,每次调用的成本实际上升了,尽管每令牌价格下降。
Anthropic在2026年5月推出了Claude Sonnet 4,输入价格为$3.00/M。Claude Sonnet 3.5也是$3.00/M——价格相同?不完全是。Sonnet 4在复杂查询中默认使用扩展思考,思考令牌按输出速率计费。在Sonnet 3.5上花费$0.04的提示词,在Sonnet 4上可能花费$0.12,因为不可见的思考开销。成本翻了三倍,而你的代码没做任何改动。
Google保持了Gemini 2.5 Flash的$0.15/M输入价格,看起来很划算。但他们增加了一个大多数团队忽略的上下文长度附加费:超过128K令牌时,费率翻倍至$0.30/M。如果你使用长文档进行RAG,实际成本是定价页面上标价的两倍。
为什么你的账单与定价页面不符
定价页面显示每令牌费率,但你的账单反映的是实际发生的情况——两者之间的差距每月都在扩大。造成差距的原因有三个:
*模型弃用轮盘赌*:当提供商停用模型时,你的API调用不会失败,而是静默地重定向到继任者。继任者可能成本更高、生成更多令牌,或者行为差异导致输出更长。除非你跟踪每次调用的成本而不仅仅是总支出,否则你不会察觉。
*隐藏令牌类别*:思考令牌、缓存令牌、系统提示令牌——两年前这些还不存在。现在它们各有各的费率。Anthropic对思考令牌收取全额输出费率,Google对缓存令牌提供25%的折扣,但对长上下文收取双倍费用。标价只是五六个数字中的一个。
*静默功能变更*:OpenAI的结构化输出模式、Anthropic的扩展思考、Google的代码执行——这些功能改变了响应包含的令牌数量。当提供商在新模型版本中默认启用某个功能时,你的令牌数会在你不知情的情况下发生变化。
谁实际上更贵了?
如果你在2026年1月冻结了代码并检查了6月的账单,很可能发生以下情况:
- 如果你使用Claude进行复杂推理(思考令牌开销)、向Gemini发送长文档(上下文附加费)、或依赖已弃用模型(被重定向),你将支付更多。
- 如果你切换到Gemini 2.5 Flash处理简单任务(确实便宜,$0.15/M),或使用DeepSeek V3(自发布以来价格未变),你将支付更少。
如果你不跟踪每次调用的成本,你就无法知道实际支出。而大多数团队正是如此。a16z的2026年调查显示,71%使用LLM API的公司不跟踪单个调用级别的支出。他们只看到月度账单上的一个项目,然后希望它看起来合理。
问题不在于提供商偷偷摸摸。他们发布了每一次价格变动。问题在于没人关注——当你检查时,三个月的漂移已经打击了你的预算。
如果你的AI账单本月让你吃惊,你并不孤单。Tokonomics按模型、功能和成本跟踪每一次API调用,并在发票到达之前发出警报。
定价数据截至2026年6月28日。请查看提供商定价页面了解最新费率。