AI News HubLIVE
サイト内リライト2 分で読了

Cursor Composer 2 + Fireworks AI

Cursorは、Cursor開発環境に最適化されたコードモデルComposer 2をリリースしました。Kimi 2.5をベースに、継続的プレトレーニングと大規模強化学習を組み合わせ、最先端のコーディング性能を実現しつつ、推論コストを6〜10倍削減します。Fireworks AIは分散型推論インフラを提供し、RLのスケーラビリティを可能にします。

先日、CursorはComposer 2をリリースしました。これはCursor開発環境に特化したコードモデルであり、汎用基盤モデルに依存するのではなく、継続的プレトレーニング、大規模強化学習(RL)、およびプロダクションフィードバックループを組み合わせることで、実際の開発者のワークフローを通じて改善される専用モデルを構築しました。Composer 2はKimi 2.5をベースとしており、ツール使用、デバッグ、端末実行、マルチファイルコード編集などの長期的なソフトウェアエンジニアリングタスクに焦点を当てています。その結果、より大きな汎用モデルよりも大幅にコスト効率が高く信頼性の高い、最先端のコーディングパフォーマンスを実現しています。

強化学習がスケールするにつれて、それは単なるモデリング手法ではなくなり、インフラストラクチャの問題になりました。各ロールアウトは完全な開発セッションに相当し、高速な推論、一貫した実行環境、分散クラスタ間での大規模モデル状態の頻繁な同期が必要です。トレーニングの安定性、環境の忠実性、ロールアウトのスループットはすべて一次のシステム制約となりました。Fireworks AIは、これらの強化学習ループを実用的にする推論層を提供し、複数のクラスタにわたる分散ロールアウトと推論インフラをサポートします。これにより、Cursorは専用の推論スタックを構築して運用することなく、大規模強化学習を実行でき、モデル行動の改善に集中できます。

パフォーマンス面では、Composer 2はCursorBenchで61.3、Terminal-Benchで61.7、SWE-bench Multilingualで73.7を達成しました。推論コストは同等の最先端モデルと比較して6〜10分の1です。強化学習は3〜4のグローバルクラスタで分散実行され、完全なモデル転送ではなく圧縮された重み同期が使用され、クロスリージョンのオーバーヘッドが大幅に削減されています。プロダクション推論能力はトレーニング中に再利用され、RLサイクルをさらに加速しています。

Cursorの研究責任者Federico Cassano氏は、「当社も他の企業と同様に有限のエンジニアしかいません。エンジニアにはトレーニングをより効率的かつ正確にする仕事に集中してもらい、推論の取り組みを別途立ち上げるよりも優先したいと考えています」と述べています。Composer 2の成功は、より広範なトレンドを裏付けています。AIにおける次の優位性は、モデル選択だけでなく、ポストトレーニングループの所有権にあるということです。強化学習をプロダクトメカニズムとして活用することで、Cursorはモデルが実際の使用環境で継続的に改善されることを実現し、Fireworks AIのインフラがそのスケーラビリティを可能にしています。

このコラボレーションは、最先端のコーディングパフォーマンスが単なるモデル規模ではなく、強化学習システムに依存することを示しています。Fireworksは、スケーラブルで分散型、コスト効率の高い推論インフラを提供することで、このシフトを可能にしています。その結果、使用される環境内で継続的に改善されるモデルという新しいカテゴリのシステムが誕生しました。このループを所有することが、AIシステムにおける決定的な優位性になりつつあります。