AI News HubLIVE
站內改寫1 分鐘閱讀

Cursor 推出 Composer 2:前沿級編碼模型,價效比最優

Cursor 釋出 Composer 2 模型,在編碼基準測試中達到前沿水平,定價為每百萬輸入令牌 0.50 美元、每百萬輸出令牌 2.50 美元,兼顧高效能與低成本。同時公開技術報告,詳解訓練方法。

Cursor 近日正式釋出 Composer 2,這是一款達到前沿水平的編碼模型,旨在以更優的價效比為使用者提供頂級智慧。該模型定價為每百萬輸入令牌 0.50 美元、每百萬輸出令牌 2.50 美元,同時提供相同智慧水平的快速變體(每百萬輸入令牌 1.50 美元、每百萬輸出令牌 7.50 美元),預設啟用快速選項,具體可參閱模型文件。

在效能方面,Composer 2 在所有測試基準上均實現大幅提升。根據官方資料,其在 CursorBench 上得分為 61.3%,Terminal-Bench 2.0 為 61.7%,SWE-bench Multilingual 為 73.7%,顯著超越前代 Composer 1.5(分別為 44.2%、47.9%、65.9%)和 Composer 1(38.0%、40.0%、56.9%)。這些進步得益於 Cursor 首次實施的連續預訓練,為強化學習提供了更堅實的基礎。透過強化學習,Composer 2 能夠在長週期任務中執行數百步操作,解決複雜編碼問題。

值得注意的是,Terminal-Bench 2.0 是由 Laude Institute 維護的終端智慧體評估基準。Anthropic 和 OpenAI 的模型得分分別使用 Claude Code 和 Simple Codex 框架計算,而 Cursor 得分則採用官方 Harbor 評估框架,預設設定,每個模型-智慧體組合執行 5 次取平均值。其他模型的得分為官方排行榜分數與 Cursor 基礎設施執行所得分數的最高值。

速度方面,所有模型的每秒令牌數(TPS)基於 2026 年 3 月 18 日的 Cursor 流量快照。Composer 與 GPT 模型的令牌大小相似,Anthropic 令牌約小 15%,TPS 已相應歸一化。輸出令牌價格也按同樣比例調整。實際速度可能因提供商容量和後續改進而異。

對於個人套餐使用者,Composer 使用計入獨立用量池,幷包含慷慨的免費額度。使用者可立即在 Cursor 中體驗 Composer 2,或透過新介面早期 alpha 版試用。Cursor 還同步釋出了配套技術報告,詳細介紹了模型訓練方法。