2026-06-27 06:15 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

Cursor Composer 2 + Fireworks AI

Cursor 發佈了 Composer 2，這是一款為 Cursor 開發環境優化的編碼模型。它基於 Kimi 2.5，結合持續預訓練和大規模強化學習，實現了前沿的編碼性能，同時推理成本降低 6-10 倍。Fireworks AI 提供分佈式推理基礎設施，使強化學習規模化成為可能。

來源Fireworks AI Blog

近日，Cursor 正式發佈了 Composer 2，這是一款專為其集成開發環境優化的專用編碼模型。與依賴通用基礎模型不同，Cursor 團隊結合了持續預訓練（continual pre-training）、大規模強化學習（RL）以及生產反饋循環，打造了一個能夠通過實際開發者工作流程持續改進的模型。該模型基於 Kimi 2.5 構建，專注於長期軟件工程任務，包括工具使用、調試、終端執行和多文件代碼編輯。其結果是達到了前沿的編碼性能，同時比更大的通用模型更具成本效益和可靠性。

強化學習在規模化過程中不再僅僅是一種建模技術，而是變成了基礎設施問題。每次展開（rollout）相當於一次完整的開發會話，需要快速推理、一致的執行環境以及分佈式集羣間頻繁的大型模型狀態同步。訓練穩定性、環境保真度和展開吞吐量都成為了一階系統約束。Fireworks AI 提供了使這些強化學習循環變得實用的推理層，支持跨多個集羣的分佈式展開和推理基礎設施。這使得 Cursor 能夠在不構建和運營專用推理棧的情況下運行大規模強化學習，從而專注於改進模型行為而非底層系統擴展。

在性能方面，Composer 2 在 CursorBench 上達到 61.3，在 Terminal-Bench 上達到 61.7，在 SWE-bench Multilingual 上達到 73.7。推理成本相比同類前沿模型降低 6-10 倍。強化學習在 3-4 個全球集羣上分佈式運行，採用壓縮權重同步而非完整模型傳輸，大大減少了跨區域同步的開銷。生產推理能力在訓練期間被複用，進一步加速了 RL 迭代。

Cursor 研究負責人 Federico Cassano 表示：“我們和其他公司一樣工程師數量有限。我們更希望工程師專注於提高訓練效率和精度，而不是另外開展推理工作。” Composer 2 的成功驗證了一個更廣泛的趨勢：在人工智能領域，下一個優勢不僅在於模型選擇，更在於對後訓練循環的掌控。通過將強化學習作為產品機制，Cursor 實現了模型在真實使用環境中的持續改進，而 Fireworks AI 的基礎設施使這一規模化成為可能。

這一合作表明，前沿編碼性能越來越依賴於強化學習系統而非單純模型規模。Fireworks 通過提供可擴展、分佈式且成本高效的推理基礎設施，支持了這一轉變。其結果是誕生了一種新型系統：在它們被使用的環境中持續改進的模型。擁有這一循環正在成為 AI 系統的決定性優勢。