AI News HubLIVE
站內改寫1 分鐘閱讀

Opus 4.7 新分詞器實際成本分析 | OpenRouter

Anthropic 為 Claude Opus 4.7 引入新分詞器,導致相同輸入消耗更多 token,成本增加 12-27%。OpenRouter 基於百萬級請求分析發現,長提示詞的成本上漲被快取部分抵消,短提示詞因輸出縮短反而更便宜。

Anthropic 在 Claude Opus 4.7 中引入了新分詞器,官方聲稱 token 膨脹範圍為 1.0–1.35 倍,取決於內容型別。儘管模型定價未變,但使用者實際支付成本將發生變化。OpenRouter 分析了其平臺上從 Opus 4.6 切換到 4.7 的使用者資料,基於超過一百萬條請求,揭示了真實成本影響。

為了隔離分詞器變化的影響,OpenRouter 採用自有的 QuadChars 分詞器作為基準。QuadChars 是一種輕量、與模型無關的字元計數方法,每 4 個可列印 ASCII 字元計為一個 token,每個非 ASCII 字元獨立計為 token。透過比較同一批使用者在使用 Opus 4.6 和 4.7 時的原生 token 與 QuadChars token 比率,可以準確衡量分詞器帶來的通脹。

研究顯示,對於 10K token 以上的生產級提示詞,Opus 4.7 分詞器產生的原生 token 比 4.6 多 32–34%;短提示詞的通脹更高,達 42–45%。但提示快取(caching)吸收了大部分通脹——快取 token 享有 90% 折扣。對於 128K+ 的極長提示詞,93% 的額外 token 落入快取,極大降低了成本影響。

在輸出長度方面,Opus 4.7 對短查詢(<2K token)更簡潔,輸出 token 中位數減少 62%;而在長上下文(10K+)中,輸出 token 中位數增加 13–30%。這種變化與分詞器共同作用,最終成本影響如下:2K–10K 提示詞成本增加 27.2%;25K–50K 增加 21.3%;128K+ 增加 15.3%;而 <2K 提示詞成本下降 1.6%,因為輸出大幅縮短完全抵消了分詞器通脹。

綜上所述,Opus 4.7 對於長提示詞使用者的實際成本上升在 12–27% 之間,但快取策略和更高效的短提示詞輸出為部分使用者帶來了好處。OpenRouter 表示將繼續監測模型變化對成本的影響。