AI News HubLIVE
サイト内リライト2 分で読了

Cursor、Composer 2 を発表:フロンティア級コーディングモデル、コストパフォーマンス最適

Cursor が Composer 2 をリリース。ベンチマークで最先端の性能を達成し、入力 100万トークンあたり 0.50 ドル、出力 100万トークンあたり 2.50 ドルという価格設定で、知能とコストの最適な組み合わせを実現。技術レポートも公開。

ソースCursor Blog

Cursor は本日、Composer 2 を正式に発表しました。これはコーディング分野でフロンティア級の知能を備え、入力 100万トークンあたり 0.50 ドル、出力 100万トークンあたり 2.50 ドルという価格で提供され、知能とコストの最適な組み合わせを実現します。さらに、同じ知能を持ちながらより高速なバリアント(入力 100万トークン 1.50 ドル、出力 100万トークン 7.50 ドル)も用意されており、デフォルトでは高速オプションが選択されます。詳細はモデルドキュメントをご参照ください。

性能面では、Composer 2 はすべてのベンチマークで前世代を大きく上回っています。CursorBench で 61.3%、Terminal-Bench 2.0 で 61.7%、SWE-bench Multilingual で 73.7% を達成し、Composer 1.5(各44.2%、47.9%、65.9%)および Composer 1(38.0%、40.0%、56.9%)から顕著な向上を示しました。これらの改善は、Cursor 初の継続事前学習に支えられており、強化学習の強固な基盤を提供します。この基盤の上で、長期的なコーディングタスクを強化学習により訓練し、Composer 2 は数百のアクションを必要とする難しい課題を解決できます。

Terminal-Bench 2.0 は Laude Institute が管理する端末エージェント評価ベンチマークです。Anthropic モデルのスコアは Claude Code ハーネス、OpenAI モデルのスコアは Simple Codex ハーネスを使用して算出されました。Cursor のスコアは、公式の Harbor 評価フレームワーク(Terminal-Bench 2.0 の指定ハーネス)をデフォルト設定で用い、モデル-エージェントペアごとに 5 回実行した平均値を報告しています。その他のモデルについては、公式リーダーボードのスコアと Cursor インフラで記録したスコアのうち高い方を採用しています。

速度に関して、全モデルの 1 秒あたりのトークン数(TPS)は 2026 年 3 月 18 日の Cursor トラフィックのスナップショットに基づきます。Composer と GPT モデルのトークンサイズは類似していますが、Anthropic のトークンは約 15% 小さいため、TPS はその差分を正規化しています。同様に、非 Anthropic モデルの出力トークン価格も約 15% 調整されています。速度はプロバイダーの容量やその後の改善により変動する可能性があります。

個人プランでは、Composer の使用は独立した使用プールの一部となり、十分な無料枠が含まれています。Composer 2 は本日より Cursor 内または新インターフェースのアルファ版でお試しいただけます。Cursor は同時に、訓練手法を解説した技術レポートも公開しています。