AI News HubLIVE
站內改寫2 分鐘閱讀

Cursor Composer 2 + Fireworks AI

Cursor 釋出了 Composer 2,這是一款為 Cursor 開發環境最佳化的編碼模型。它基於 Kimi 2.5,結合持續預訓練和大規模強化學習,實現了前沿的編碼效能,同時推理成本降低 6-10 倍。Fireworks AI 提供分散式推理基礎設施,使強化學習規模化成為可能。

近日,Cursor 正式釋出了 Composer 2,這是一款專為其整合開發環境最佳化的專用編碼模型。與依賴通用基礎模型不同,Cursor 團隊結合了持續預訓練(continual pre-training)、大規模強化學習(RL)以及生產反饋迴圈,打造了一個能夠透過實際開發者工作流程持續改進的模型。該模型基於 Kimi 2.5 構建,專注於長期軟體工程任務,包括工具使用、除錯、終端執行和多檔案程式碼編輯。其結果是達到了前沿的編碼效能,同時比更大的通用模型更具成本效益和可靠性。

強化學習在規模化過程中不再僅僅是一種建模技術,而是變成了基礎設施問題。每次展開(rollout)相當於一次完整的開發會話,需要快速推理、一致的執行環境以及分散式叢集間頻繁的大型模型狀態同步。訓練穩定性、環境保真度和展開吞吐量都成為了一階系統約束。Fireworks AI 提供了使這些強化學習迴圈變得實用的推理層,支援跨多個叢集的分散式展開和推理基礎設施。這使得 Cursor 能夠在不構建和運營專用推理棧的情況下執行大規模強化學習,從而專注於改進模型行為而非底層系統擴充套件。

在效能方面,Composer 2 在 CursorBench 上達到 61.3,在 Terminal-Bench 上達到 61.7,在 SWE-bench Multilingual 上達到 73.7。推理成本相比同類前沿模型降低 6-10 倍。強化學習在 3-4 個全球叢集上分散式執行,採用壓縮權重同步而非完整模型傳輸,大大減少了跨區域同步的開銷。生產推理能力在訓練期間被複用,進一步加速了 RL 迭代。

Cursor 研究負責人 Federico Cassano 表示:“我們和其他公司一樣工程師數量有限。我們更希望工程師專注於提高訓練效率和精度,而不是另外開展推理工作。” Composer 2 的成功驗證了一個更廣泛的趨勢:在人工智慧領域,下一個優勢不僅在於模型選擇,更在於對後訓練迴圈的掌控。透過將強化學習作為產品機制,Cursor 實現了模型在真實使用環境中的持續改進,而 Fireworks AI 的基礎設施使這一規模化成為可能。

這一合作表明,前沿編碼效能越來越依賴於強化學習系統而非單純模型規模。Fireworks 透過提供可擴充套件、分散式且成本高效的推理基礎設施,支援了這一轉變。其結果是誕生了一種新型系統:在它們被使用的環境中持續改進的模型。擁有這一迴圈正在成為 AI 系統的決定性優勢。