2026-06-27 06:15 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

Cursor Composer 2 + Fireworks AI

Cursor 釋出了 Composer 2，這是一款為 Cursor 開發環境最佳化的編碼模型。它基於 Kimi 2.5，結合持續預訓練和大規模強化學習，實現了前沿的編碼效能，同時推理成本降低 6-10 倍。Fireworks AI 提供分散式推理基礎設施，使強化學習規模化成為可能。

來源Fireworks AI Blog

近日，Cursor 正式釋出了 Composer 2，這是一款專為其整合開發環境最佳化的專用編碼模型。與依賴通用基礎模型不同，Cursor 團隊結合了持續預訓練（continual pre-training）、大規模強化學習（RL）以及生產反饋迴圈，打造了一個能夠透過實際開發者工作流程持續改進的模型。該模型基於 Kimi 2.5 構建，專注於長期軟體工程任務，包括工具使用、除錯、終端執行和多檔案程式碼編輯。其結果是達到了前沿的編碼效能，同時比更大的通用模型更具成本效益和可靠性。

強化學習在規模化過程中不再僅僅是一種建模技術，而是變成了基礎設施問題。每次展開（rollout）相當於一次完整的開發會話，需要快速推理、一致的執行環境以及分散式叢集間頻繁的大型模型狀態同步。訓練穩定性、環境保真度和展開吞吐量都成為了一階系統約束。Fireworks AI 提供了使這些強化學習迴圈變得實用的推理層，支援跨多個叢集的分散式展開和推理基礎設施。這使得 Cursor 能夠在不構建和運營專用推理棧的情況下執行大規模強化學習，從而專注於改進模型行為而非底層系統擴充套件。

在效能方面，Composer 2 在 CursorBench 上達到 61.3，在 Terminal-Bench 上達到 61.7，在 SWE-bench Multilingual 上達到 73.7。推理成本相比同類前沿模型降低 6-10 倍。強化學習在 3-4 個全球叢集上分散式執行，採用壓縮權重同步而非完整模型傳輸，大大減少了跨區域同步的開銷。生產推理能力在訓練期間被複用，進一步加速了 RL 迭代。

Cursor 研究負責人 Federico Cassano 表示：“我們和其他公司一樣工程師數量有限。我們更希望工程師專注於提高訓練效率和精度，而不是另外開展推理工作。” Composer 2 的成功驗證了一個更廣泛的趨勢：在人工智慧領域，下一個優勢不僅在於模型選擇，更在於對後訓練迴圈的掌控。透過將強化學習作為產品機制，Cursor 實現了模型在真實使用環境中的持續改進，而 Fireworks AI 的基礎設施使這一規模化成為可能。

這一合作表明，前沿編碼效能越來越依賴於強化學習系統而非單純模型規模。Fireworks 透過提供可擴充套件、分散式且成本高效的推理基礎設施，支援了這一轉變。其結果是誕生了一種新型系統：在它們被使用的環境中持續改進的模型。擁有這一迴圈正在成為 AI 系統的決定性優勢。