Anthropic、Claude Opus 4.8をリリース
AnthropicはClaude Opus 4.8をリリースしました。Opus 4.7のアップグレード版で、コーディング、エージェント作業、推論、知識作業の改善を謳っています。新機能として努力制御、動的ワークフロー、Messages APIのライブ更新を搭載。標準料金は百万トークンあたり入力5ドル、出力25ドル、高速モードは入力10ドル、出力50ドル(2.5倍速)で据え置き。初期テスターからはGPT-5.5とのコストパリティやツールステップの減少が報告されています。将来のロードマップとしてMythosクラスのモデルやサイバーセキュリティプロジェクトGlasswingも発表されました。
記事インテリジェンス
要点
- Claude Opus 4.8はOpus 4.7からコーディング、エージェント作業、推論、知識作業を改善。
- 新機能:努力制御、動的ワークフロー、Messages APIのライブ更新。
- 料金は標準$5/$25、高速$10/$50(百万トークンあたり)で据え置き。
- Anthropicは将来のMythosクラスモデルとGlasswingプロジェクトを予告。
重要な理由
このニュースが重要なのは、Claude Opus 4.8はOpus 4.7からコーディング、エージェント作業、推論、知識作業を改善ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
AnthropicはClaude Opus 4.8をリリースしました。これは前バージョンOpus 4.7のアップグレードであり、コーディング、エージェント作業、推論、ナレッジワークの各分野で改善が見られるとのことです。このプラットフォームはclaude.ai、Claude Code、Claude API(API名はclaude-opus-4-8)を通じて利用可能です。
また、同社は製品ラインナップの一部を変更しました。claude.aiとCoworkのユーザーは、Claudeが応答に費やす努力の度合いを設定できるようになりました。これは基本的にモデルが消費するトークン数に影響します。Claude Codeには動的ワークフローが追加され、作業の計画、サブエージェントの並列実行、出力の検証、ユーザーへの報告を自動化します。さらに、Messages APIはメッセージ配列のライブ変更をサポートし、開発者がタスク中に指示を更新できるようになりました。これにより、プロンプトキャッシュを破壊したり、別途ユーザーターンを必要とすることはありません。
価格については、Claude Opus 4.8の標準モード(非高速)は、入力トークン100万あたり5ドル、出力トークン100万あたり25ドルで据え置きです。高速モードは入力100万あたり10ドル、出力100万あたり50ドルで、速度は2.5倍になります。
AnthropicはOpus 4.8をコーディングとエージェントワークフロー向けに設計したと位置づけており、モデルがコンテキスト内でツールを使用し、自身の作業をチェックできるとしています。Opus 4.7と比較して、Opus 4.8はコーディング、エージェントスキル、推論、オフィスワークのベンチマークで向上しています。詳細についてはシステムカードが参照可能です。
Anthropicの発表では、ソフトウェア開発、法律、金融、研究分野など複数の企業が幅広いリリース前にプラットフォームをテストしたとされています。テスト担当者はエージェントワークフローに好意的なコメントを寄せており、ある企業は内部ベンチマークテストでGPT-5.5とコストパリティがあると指摘しました。CursorBenchはOpus 4.8が同じ出力レベルを達成するために必要なツールステップが少ないとコメントしています。
Anthropicは、Opus 4.8が欠陥のあるコードをコメントなしで渡す可能性がOpus 4.7よりも4倍低いと述べています。また、欺瞞や悪用に同調する傾向がOpus 4.7よりも低く、Claude Mythos Previewと同等であるとしています。
努力制御により、ユーザーは品質、速度、トークン消費率のトレードオフを管理できます。Opus 4.8はデフォルトで高努力に設定されていますが、コーディングタスクでは、高いデフォルト設定でもOpus 4.7と同程度のトークン数しか使用せず、パフォーマンスは向上しています。ユーザーはより多くの計算を必要とする作業のために'xhigh'を選択することもできます。Anthropicは、結果として生じるトークン使用量の増加に対応するためにClaude Codeのレート制限を引き上げたと述べています。
Claude Codeの動的ワークフローは大規模なコードベース向けに設計されており、数十万行のコードベースを移行できます。これらの機能は現在研究プレビュー段階で、Enterprise、Team、Maxプランで利用可能です。
Messages APIはエージェントの実行中に指示を更新でき、メッセージ配列内の編集を使用して、例えば権限の更新、トークンバジェットやコンテキストの変更をエージェントが作業を続けながら行えます。
Anthropicはこのリリースにあわせて、現在の能力レベルをより低コストで提供するモデルを開発中であり、現在のOpusプラットフォームよりも優れたモデルクラスをリリースすることを示唆しました。ロードマップにはProject Glasswingが含まれており、このプロジェクトでは複数の組織がClaude Mythos Previewをサイバーセキュリティスキャンに使用しています。Anthropicは、その能力レベルのモデルはすべての顧客にリリースする前に強力なセーフガードが必要だと述べています。今後数週間以内に「Mythosクラス」モデルを顧客に提供する予定です。
4.8の追加制御により、同社がサブスクリプションからトークンベースの課金に移行するにつれて、ユーザーにコストと労力のトレードオフが明らかになります。