2026-06-30 23:22 UTC+8站内改写2 分钟阅读更新: 2026-06-30 23:27 UTC+8

OpenAI、Anthropic、Google——6个月内14次定价变动，大多数团队都忽略了

2026年1月至6月，OpenAI、Anthropic和Google共进行了14次模型定价调整。模型弃用、隐藏令牌类别和静默功能变更导致实际账单与标价不符。追踪每次调用的成本至关重要，否则预算会悄然超支。

来源Hacker News AI作者: aitoukhrib

如果你在2026年1月检查过LLM API的定价，然后选了一个模型并据此预算，之后就没再关注过，那么你现在支付的价格可能已经变了。

从1月到6月，OpenAI、Anthropic和Google对其模型系列共进行了14次定价调整。一些价格下降了，一些上涨了，还有一些模型被弃用，由更贵的继任者取代。而这些变化中，没有任何一家提供商通过邮件通知你。

没人谈论的变化

OpenAI在2026年第一季度弃用了GPT-4 Turbo。如果你的代码仍指向gpt-4-turbo，它会静默地重定向到GPT-4o。日志中的名字相同，但价格不同。GPT-4o每令牌的价格比旧Turbo便宜——输出令牌率从$0.03/M降至$0.01/M。听起来不错，但你的提示词原本针对Turbo优化，而GPT-4o在相同提示下生成的输出令牌多30-40%。因此，每次调用的成本实际上升了，尽管每令牌价格下降。

Anthropic在2026年5月推出了Claude Sonnet 4，输入价格为$3.00/M。Claude Sonnet 3.5也是$3.00/M——价格相同？不完全是。Sonnet 4在复杂查询中默认使用扩展思考，思考令牌按输出速率计费。在Sonnet 3.5上花费$0.04的提示词，在Sonnet 4上可能花费$0.12，因为不可见的思考开销。成本翻了三倍，而你的代码没做任何改动。

Google保持了Gemini 2.5 Flash的$0.15/M输入价格，看起来很划算。但他们增加了一个大多数团队忽略的上下文长度附加费：超过128K令牌时，费率翻倍至$0.30/M。如果你使用长文档进行RAG，实际成本是定价页面上标价的两倍。

为什么你的账单与定价页面不符

定价页面显示每令牌费率，但你的账单反映的是实际发生的情况——两者之间的差距每月都在扩大。造成差距的原因有三个：

*模型弃用轮盘赌*：当提供商停用模型时，你的API调用不会失败，而是静默地重定向到继任者。继任者可能成本更高、生成更多令牌，或者行为差异导致输出更长。除非你跟踪每次调用的成本而不仅仅是总支出，否则你不会察觉。

*隐藏令牌类别*：思考令牌、缓存令牌、系统提示令牌——两年前这些还不存在。现在它们各有各的费率。Anthropic对思考令牌收取全额输出费率，Google对缓存令牌提供25%的折扣，但对长上下文收取双倍费用。标价只是五六个数字中的一个。

*静默功能变更*：OpenAI的结构化输出模式、Anthropic的扩展思考、Google的代码执行——这些功能改变了响应包含的令牌数量。当提供商在新模型版本中默认启用某个功能时，你的令牌数会在你不知情的情况下发生变化。

谁实际上更贵了？

如果你在2026年1月冻结了代码并检查了6月的账单，很可能发生以下情况：

如果你使用Claude进行复杂推理（思考令牌开销）、向Gemini发送长文档（上下文附加费）、或依赖已弃用模型（被重定向），你将支付更多。
如果你切换到Gemini 2.5 Flash处理简单任务（确实便宜，$0.15/M），或使用DeepSeek V3（自发布以来价格未变），你将支付更少。

如果你不跟踪每次调用的成本，你就无法知道实际支出。而大多数团队正是如此。a16z的2026年调查显示，71%使用LLM API的公司不跟踪单个调用级别的支出。他们只看到月度账单上的一个项目，然后希望它看起来合理。

问题不在于提供商偷偷摸摸。他们发布了每一次价格变动。问题在于没人关注——当你检查时，三个月的漂移已经打击了你的预算。

如果你的AI账单本月让你吃惊，你并不孤单。Tokonomics按模型、功能和成本跟踪每一次API调用，并在发票到达之前发出警报。

定价数据截至2026年6月28日。请查看提供商定价页面了解最新费率。