2026-05-15 12:34 UTC+9サイト内リライト2 分で読了更新: 2026-06-27 09:25 UTC+9

Cursor、Composer 2 を発表：フロンティア級コーディングモデル、コストパフォーマンス最適

Cursor が Composer 2 をリリース。ベンチマークで最先端の性能を達成し、入力 100万トークンあたり 0.50 ドル、出力 100万トークンあたり 2.50 ドルという価格設定で、知能とコストの最適な組み合わせを実現。技術レポートも公開。

ソースCursor Blog

記事インテリジェンス

エンジニア上級

要点

Composer 2 は Terminal-Bench 2.0 や SWE-bench Multilingual など全ベンチマークで大幅な改善を示す。
価格は入力 100万トークン 0.50 ドル、出力 100万トークン 2.50 ドル。高速バリアントも用意。
初の継続事前学習と強化学習により、数百ステップを要する長期的なコーディングタスクを解決。
Cursor および新インターフェースのアルファ版で即日利用可能。

重要な理由

このニュースが重要なのは、Composer 2 は Terminal-Bench 2.0 や SWE-bench Multilingual など全ベンチマークで大幅な改善を示すためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

このパネルは AI が生成し、正確性を確認済みです。

Cursor は本日、Composer 2 を正式に発表しました。これはコーディング分野でフロンティア級の知能を備え、入力 100万トークンあたり 0.50 ドル、出力 100万トークンあたり 2.50 ドルという価格で提供され、知能とコストの最適な組み合わせを実現します。さらに、同じ知能を持ちながらより高速なバリアント（入力 100万トークン 1.50 ドル、出力 100万トークン 7.50 ドル）も用意されており、デフォルトでは高速オプションが選択されます。詳細はモデルドキュメントをご参照ください。

性能面では、Composer 2 はすべてのベンチマークで前世代を大きく上回っています。CursorBench で 61.3%、Terminal-Bench 2.0 で 61.7%、SWE-bench Multilingual で 73.7% を達成し、Composer 1.5（各44.2%、47.9%、65.9%）および Composer 1（38.0%、40.0%、56.9%）から顕著な向上を示しました。これらの改善は、Cursor 初の継続事前学習に支えられており、強化学習の強固な基盤を提供します。この基盤の上で、長期的なコーディングタスクを強化学習により訓練し、Composer 2 は数百のアクションを必要とする難しい課題を解決できます。

Terminal-Bench 2.0 は Laude Institute が管理する端末エージェント評価ベンチマークです。Anthropic モデルのスコアは Claude Code ハーネス、OpenAI モデルのスコアは Simple Codex ハーネスを使用して算出されました。Cursor のスコアは、公式の Harbor 評価フレームワーク（Terminal-Bench 2.0 の指定ハーネス）をデフォルト設定で用い、モデル-エージェントペアごとに 5 回実行した平均値を報告しています。その他のモデルについては、公式リーダーボードのスコアと Cursor インフラで記録したスコアのうち高い方を採用しています。

速度に関して、全モデルの 1 秒あたりのトークン数（TPS）は 2026 年 3 月 18 日の Cursor トラフィックのスナップショットに基づきます。Composer と GPT モデルのトークンサイズは類似していますが、Anthropic のトークンは約 15% 小さいため、TPS はその差分を正規化しています。同様に、非 Anthropic モデルの出力トークン価格も約 15% 調整されています。速度はプロバイダーの容量やその後の改善により変動する可能性があります。

個人プランでは、Composer の使用は独立した使用プールの一部となり、十分な無料枠が含まれています。Composer 2 は本日より Cursor 内または新インターフェースのアルファ版でお試しいただけます。Cursor は同時に、訓練手法を解説した技術レポートも公開しています。