Cursorの新モデル、なぜまだKimiを使っている?マスクはなぜ応援している?
CursorはComposer 2.5をリリース。Kimi K2.5をベースに、後処理と強化学習に計算リソースの85%を投入し、Claude Opus 4.7に10分の1のコストで迫る性能を実現。以前批判していたマスク氏は、SpaceXAIとの計算リソース契約により支持に転じた。モデルは複数のベンチマークでOpus 4.7に近いスコアを達成し、価格も大幅に低減。
Cursorは、最新モデルComposer 2.5をリリースした。このモデルは、オープンソースのKimi K2.5を基盤とし、Cursorがポストトレーニングと強化学習に総計算量の85%を投入して開発された。その結果、AnthropicのClaude Opus 4.7に迫る性能を、わずか10分の1のコストで実現した。
ベンチマーク結果はその近接性を示している:Terminal-Bench 2.0で69.3%対69.4%、SWE-Bench Multilingualで79.8%対80.5%、CursorBench v3.1で63.2%対64.8%。また、長時間タスクでの信頼性、複雑な指示への従順性、コラボレーションの向上も強調されている。
価格設定は攻撃的で、入力100万トークンあたり0.50ドル、出力100万トークンあたり2.50ドル。さらに高速なバリアントはそれぞれ3ドルと15ドル。初期ユーザーからは高い満足度が報告され、元Snapchat機械学習エンジニアは、最も高価なモデルをすべてのタスクに使うのは80%の浪費だと述べた。
Cursorの訓練革新には、強化学習における方向性フィードバックが含まれる。これは、エラーが発生した時点で直接修正を提供するもので、従来の単一報酬よりも効果的だ。合成データ生成は25倍にスケールされ、「機能削除」などの手法でより難しいタスクが生成された。内部では、非同期通信やMoEモデル向けのカスタム並列化戦略など、最適化が施されている。
イーロン・マスクとの関係は劇的に変化した。以前はCursorを「他のモデルの殻」と批判したマスクだが、今ではComposer 2.5を積極的に宣伝している。これは、SpaceXAIにCursorの技術へのアクセスと、600億ドルでの買収優先権を与える契約に基づく。この契約は、500億ドルの評価額で行われていた20億ドルの資金調達ラウンドを頓挫させたとされる。マスクのColossus 2スーパーコンピューターはCursorのモデル訓練に使用され、両社はさらに大規模なモデルをゼロから開発中である。
Cursorが自社開発モデルに舵を切った背景には、AnthropicのClaude Codeとの競争がある。かつてのパートナーが競合に転じたことで、競合他社のAPIへの依存を減らす必要に迫られた。Cursorは、自社の真の価値はベースモデルではなく、強化学習のワークフローと開発者のインタラクションデータにあると主張する。これにより、フロンティアモデルに匹敵する性能を低コストで提供できるとしている。