Cursor Composer 2 + Fireworks AI
Cursor 發佈了 Composer 2,這是一款為 Cursor 開發環境優化的編碼模型。它基於 Kimi 2.5,結合持續預訓練和大規模強化學習,實現了前沿的編碼性能,同時推理成本降低 6-10 倍。Fireworks AI 提供分佈式推理基礎設施,使強化學習規模化成為可能。
近日,Cursor 正式發佈了 Composer 2,這是一款專為其集成開發環境優化的專用編碼模型。與依賴通用基礎模型不同,Cursor 團隊結合了持續預訓練(continual pre-training)、大規模強化學習(RL)以及生產反饋循環,打造了一個能夠通過實際開發者工作流程持續改進的模型。該模型基於 Kimi 2.5 構建,專注於長期軟件工程任務,包括工具使用、調試、終端執行和多文件代碼編輯。其結果是達到了前沿的編碼性能,同時比更大的通用模型更具成本效益和可靠性。
強化學習在規模化過程中不再僅僅是一種建模技術,而是變成了基礎設施問題。每次展開(rollout)相當於一次完整的開發會話,需要快速推理、一致的執行環境以及分佈式集羣間頻繁的大型模型狀態同步。訓練穩定性、環境保真度和展開吞吐量都成為了一階系統約束。Fireworks AI 提供了使這些強化學習循環變得實用的推理層,支持跨多個集羣的分佈式展開和推理基礎設施。這使得 Cursor 能夠在不構建和運營專用推理棧的情況下運行大規模強化學習,從而專注於改進模型行為而非底層系統擴展。
在性能方面,Composer 2 在 CursorBench 上達到 61.3,在 Terminal-Bench 上達到 61.7,在 SWE-bench Multilingual 上達到 73.7。推理成本相比同類前沿模型降低 6-10 倍。強化學習在 3-4 個全球集羣上分佈式運行,採用壓縮權重同步而非完整模型傳輸,大大減少了跨區域同步的開銷。生產推理能力在訓練期間被複用,進一步加速了 RL 迭代。
Cursor 研究負責人 Federico Cassano 表示:“我們和其他公司一樣工程師數量有限。我們更希望工程師專注於提高訓練效率和精度,而不是另外開展推理工作。” Composer 2 的成功驗證了一個更廣泛的趨勢:在人工智能領域,下一個優勢不僅在於模型選擇,更在於對後訓練循環的掌控。通過將強化學習作為產品機制,Cursor 實現了模型在真實使用環境中的持續改進,而 Fireworks AI 的基礎設施使這一規模化成為可能。
這一合作表明,前沿編碼性能越來越依賴於強化學習系統而非單純模型規模。Fireworks 通過提供可擴展、分佈式且成本高效的推理基礎設施,支持了這一轉變。其結果是誕生了一種新型系統:在它們被使用的環境中持續改進的模型。擁有這一循環正在成為 AI 系統的決定性優勢。