2026-05-29 06:20 UTC+9サイト内リライト1 分で読了更新: 2026-06-30 22:03 UTC+9

Anthropic、Claude Opus 4.8を公開——「控えめだが確かな改善」、GPT-5.5をほとんどのベンチマークで上回る

AnthropicはClaude Opus 4.8をリリース。多くのベンチマークでGPT-5.5やGemini 3.1 Proを上回り、コードエラーの自己検出率は前世代比4倍。同時に、数百の並列サブエージェントを起動して大規模なコードベース移行などを処理する動的ワークフローも導入した。

ソースThe Decoder著者: Matthias Bastian

Anthropicは、最新のAIモデル「Claude Opus 4.8」を公開した。同社はこれを「控えめだが確かな改善」と評しており、多くのベンチマークテストでOpenAIのGPT-5.5やGoogleのGemini 3.1 Proを上回る性能を示した。特にコーディングや論理的推論のタスクで顕著な向上が見られる。

Claude Opus 4.8は自己修正能力も大幅に強化されており、コード内のエラーを検出・修正する頻度が前世代の4倍に達した。この進歩は、AI支援プログラミングに依存する開発チームにとって重要な意味を持ち、手動レビューの負担を大幅に軽減できる。

さらに、Anthropicは「動的ワークフロー」と呼ばれる新機能も導入した。これにより、コードベース全体の移行やリファクタリングのような大規模なタスクを処理するために、数百もの並列サブエージェントを起動できる。各サブエージェントは独立してサブタスクを実行し、リアルタイムで進捗を同期するため、複雑なプロジェクトの処理効率が大幅に向上する。

Claude Opus 4.8は現在、AnthropicのAPIを通じて利用可能で、同社の公式チャットプラットフォームでも提供されている。同社は今後もモデルの性能最適化を継続し、次期バージョンではさらに多くのエンタープライズ機能を追加する予定としている。