AI News HubLIVE
サイト内リライト2 分で読了

Claude Sonnet 5 発表:Opus 4.8に迫る性能でより低価格なエージェントモデル

AnthropicがClaude Sonnet 5をリリース。これはこれまでで最もエージェント能力の高いSonnetモデルであり、推論、ツール使用、コーディング、知識作業において前世代のSonnet 4.6を大幅に上回り、性能はOpus 4.8に迫る。本日より全プランで利用可能。

Anthropicは本日、Claude Sonnet 5をリリースしました。これはSonnetシリーズの中で最もエージェント能力の高いモデルです。このモデルは、計画を立て、ブラウザやターミナルなどのツールを使用し、自律的に実行することができます。わずか数ヶ月前には、このレベルの能力を実現するには、より大規模で高価なモデルが必要でした。

多くの開発者にとって、エージェント型AIの時代はSonnetクラスのモデルから始まりました。Claude Sonnet 3.5、3.6、3.7は、コーディングとツール使用において印象的なスキルを示した最初のモデルです。しかし最近では、エージェント能力の最も明確な向上はOpusクラスのモデルで見られていました。Sonnet 5はそのギャップを縮めます。その性能はOpus 4.8に近いものの、より低価格です。前世代のSonnet 4.6と比較して、推論、ツール使用、コーディング、知識作業などの重要なエージェント性能の側面で大幅な改善が見られます。

早期アクセスパートナーからのフィードバックは一貫して、Sonnet 5は前世代よりもはるかにエージェント能力が高いと評価しています。テスターは、複雑なタスクを最後まで完了する様子、明示的に求められなくても自身の出力をチェックする様子、そしてこれらすべてのエージェント作業を魅力的な価格で実現する様子を報告しています。

安全性評価では、Sonnet 5は全体的にSonnet 4.6よりも望ましくない行動の発生率が低く、悪意のあるリクエストの拒否やプロンプトインジェクション攻撃に対する耐性が向上しています。また、幻覚やお世辞の発生率もSonnet 4.6よりも低くなっています。ただし、自動化された行動監査では、より能力の高いOpus 4.8やClaude Mythos Previewと比較して、やや高い率の不適切な行動が見られました。Sonnet 5はサイバーセキュリティタスクを実行する能力が現在のOpusモデルよりも大幅に低く、Anthropicはデフォルトでサイバーセーフガードを有効にしています。

本日より、Claude Sonnet 5は全プランで利用可能です。FreeプランとProプランではデフォルトモデルとなり、Max、Team、Enterpriseユーザーも利用できます。また、Claude CodeおよびClaudeプラットフォームでも利用可能で、2026年8月31日までの導入キャンペーン価格として、入力トークン100万あたり2ドル、出力トークン100万あたり10ドルで提供されます。その後は、入力トークン100万あたり3ドル、出力トークン100万あたり15ドルになります。開発者はClaude APIを介してclaude-sonnet-5を使用できます。

Anthropicはまた、Chat、Cowork、Claude Code、Claudeプラットフォーム全体でレート制限を引き上げ、より高い努力レベルでのトークン使用量の増加に対応しています。ユーザーはプロジェクトに適したレベルを選択できます。

完全な安全性評価とベンチマーク結果は、Claude Sonnet 5システムカードで報告されています。