AI News HubLIVE
サイト内リライト2 分で読了

Opus 4.7の新しいトークナイザー:実際のコスト影響 | OpenRouter

AnthropicがClaude Opus 4.7に導入した新トークナイザーにより、同じ入力で消費トークン数が増加し、コストが12~27%上昇。ただし、短いプロンプトでは出力が短縮され、かえって安くなる。OpenRouterが100万件超のリクエストを分析。

AnthropicはClaude Opus 4.7に新しいトークナイザーを導入し、公式にはトークン数の増加率は内容により1.0~1.35倍と発表しています。モデル価格は変わらないものの、ユーザーの実際の支払額は変化します。OpenRouterは、Opus 4.6から4.7に切り替えたユーザーの100万件以上のリクエストデータを分析し、実際のコスト影響を明らかにしました。

トークナイザーの変更を分離するため、OpenRouterは独自のQuadCharsトークナイザーをベースラインとして使用しました。QuadCharsは、4つの印字可能なASCII文字を1トークンとし、非ASCII文字を個別にカウントする軽量・モデル非依存の手法です。同じユーザーがOpus 4.6と4.7を使用した際のネイティブトークン数とQuadCharsトークン数の比率を比較することで、トークナイザーのインフレーションを正確に測定できます。

研究によると、10Kトークン以上のプロンプトでは、Opus 4.7のトークナイザーは4.6よりも32~34%多くのネイティブトークンを生成します。短いプロンプトではさらに高く42~45%です。しかし、プロンプトキャッシングがインフレの大部分を吸収します。キャッシュされたトークンは90%割引されます。128K+の非常に長いプロンプトでは、追加トークンの93%がキャッシュに落ち、コスト影響を大幅に軽減します。

出力長については、Opus 4.7は短いクエリ(2Kトークン未満)でより簡潔になり、出力トークンの中央値は62%減少しました。一方、長いコンテキスト(10K+)では出力トークンの中央値が13~30%増加しています。これらの変化がトークナイザーと組み合わさり、最終的なコスト影響は以下の通りです:2K~10Kトークンのプロンプトではコストが27.2%上昇、25K~50Kでは21.3%上昇、128K+では15.3%上昇、一方2K未満では出力短縮がトークナイザーのオーバーヘッドを完全に相殺し、コストが1.6%低下しました。

まとめると、Opus 4.7では長いプロンプトのユーザーに対して実際のコストが12~27%上昇しますが、キャッシュ戦略と短いプロンプトでの効率化により、一部のユーザーは恩恵を受けます。OpenRouterは今後もモデル変更がコストに与える影響を監視していく予定です。