2026-05-15 11:40 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

Opus 4.7 新分詞器實際成本分析 | OpenRouter

Anthropic 為 Claude Opus 4.7 引入新分詞器，導致相同輸入消耗更多 token，成本增加 12-27%。OpenRouter 基於百萬級請求分析發現，長提示詞的成本上漲被快取部分抵消，短提示詞因輸出縮短反而更便宜。

Anthropic 在 Claude Opus 4.7 中引入了新分詞器，官方聲稱 token 膨脹範圍為 1.0–1.35 倍，取決於內容型別。儘管模型定價未變，但使用者實際支付成本將發生變化。OpenRouter 分析了其平臺上從 Opus 4.6 切換到 4.7 的使用者資料，基於超過一百萬條請求，揭示了真實成本影響。

為了隔離分詞器變化的影響，OpenRouter 採用自有的 QuadChars 分詞器作為基準。QuadChars 是一種輕量、與模型無關的字元計數方法，每 4 個可列印 ASCII 字元計為一個 token，每個非 ASCII 字元獨立計為 token。透過比較同一批使用者在使用 Opus 4.6 和 4.7 時的原生 token 與 QuadChars token 比率，可以準確衡量分詞器帶來的通脹。

研究顯示，對於 10K token 以上的生產級提示詞，Opus 4.7 分詞器產生的原生 token 比 4.6 多 32–34%；短提示詞的通脹更高，達 42–45%。但提示快取（caching）吸收了大部分通脹——快取 token 享有 90% 折扣。對於 128K+ 的極長提示詞，93% 的額外 token 落入快取，極大降低了成本影響。

在輸出長度方面，Opus 4.7 對短查詢（<2K token）更簡潔，輸出 token 中位數減少 62%；而在長上下文（10K+）中，輸出 token 中位數增加 13–30%。這種變化與分詞器共同作用，最終成本影響如下：2K–10K 提示詞成本增加 27.2%；25K–50K 增加 21.3%；128K+ 增加 15.3%；而 <2K 提示詞成本下降 1.6%，因為輸出大幅縮短完全抵消了分詞器通脹。

綜上所述，Opus 4.7 對於長提示詞使用者的實際成本上升在 12–27% 之間，但快取策略和更高效的短提示詞輸出為部分使用者帶來了好處。OpenRouter 表示將繼續監測模型變化對成本的影響。