AI News HubLIVE
站内改写

Claude Opus 4.8:「控えめだが確かな改善」

AnthropicがClaude Opus 4.8をリリース。前モデルからの「控えめだが確かな改善」と説明。正直さが向上し、根拠のない主張を避ける傾向が強まった。コードの欠陥を見逃す率は4分の1に減少。また、会話途中でのシステムプロンプト変更やプロンプトキャッシュの最小トークン数引き下げなどの新機能を搭載。

記事インテリジェンス

エンジニア中級

要点

  • AnthropicがClaude Opus 4.8をリリース。『控えめだが確かな改善』と評価。
  • 正直さが向上:根拠のない主張を避け、コードの欠陥を見逃す率が4分の1に減少。
  • 新機能:会話途中でのシステムプロンプト変更、プロンプトキャッシュの最小トークン数を1024に引き下げ。
  • 料金は前モデルと同額だが、Fast Modeの価格が大幅に低減。

重要な理由

このニュースが重要なのは、AnthropicがClaude Opus 4.8をリリース。『控えめだが確かな改善』と評価ためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

Anthropicは本日、最新の言語モデルClaude Opus 4.8をリリースした。多くのAI企業が「画期的な進歩」を謳う中、同社はこれを「控えめだが確かな改善(a modest but tangible improvement)」と正直に評価している。この姿勢はアップデート全体に貫かれている。

Opus 4.8の最大の改善点は「正直さ」にある。同社は、すべてのモデルに正直さを訓練しているが、特に根拠のない主張を避けるようにしている。初期のテスターは、Opus 4.8が自身の作業に関する不確実性をより積極的に報告し、根拠のない主張を減らす傾向があると報告している。評価では、Opus 4.8はコードの欠陥を見逃す可能性が前モデルより約4分の1に減少した。システムカードによると、Opus 4.8は6モデル中すべてのベンチマークで最も低い誤り率を記録しており、これは主に不確実な質問に対して回答を控えることで達成されている。

価格は前モデルと変わらず、入力100万トークンあたり5ドル、出力100万トークンあたり25ドル。Fast Modeはその2倍の価格だが、前モデルのFast Mode(30/150ドル)から大幅に値下げされている。Fast Modeは現在研究プレビューに参加する組織のみ利用可能。

知識のカットオフ日とトレーニングデータのカットオフ日はともに2026年1月で、4.7と同じ。コンテキストウィンドウは100万トークン、最大出力は128,000トークン。

新機能として注目すべきは「会話途中のシステムメッセージ」だ。Opus 4.8では、会話のユーザーターン直後にrole: "system"のメッセージを挿入できる。これにより、長時間の会話中にシステムプロンプトを書き換えずに指示を更新でき、プロンプトキャッシュのヒットを維持しつつエージェントループの入力コストを削減できる。また、プロンプトキャッシュの最小トークン数が4.7の4,096から1,024に引き下げられ、より多くのプロンプトがキャッシュの恩恵を受けられるようになった。

Opus 4.8には5つの思考レベル(low、medium、high、xhigh、max)があり、推論の深さを制御できる。著者は各レベルでペリカンが自転車に乗る画像を生成し、レベルの違いを比較している。maxレベルが最も優れた結果を出したが、25入力トークン、17,167出力トークンで総コスト約43セントと高額だった。

Claude Opus 4.8は破壊的なアップデートではないが、正直さと新機能の面で重要な進歩を示している。Anthropicは今後、Opusと同等の能力を低コストで提供するモデルの開発を進めるとしている。