Cursor 推出 Composer 2:前沿级编码模型,性价比最优
Cursor 发布 Composer 2 模型,在编码基准测试中达到前沿水平,定价为每百万输入令牌 0.50 美元、每百万输出令牌 2.50 美元,兼顾高性能与低成本。同时公开技术报告,详解训练方法。
Cursor 近日正式发布 Composer 2,这是一款达到前沿水平的编码模型,旨在以更优的性价比为用户提供顶级智能。该模型定价为每百万输入令牌 0.50 美元、每百万输出令牌 2.50 美元,同时提供相同智能水平的快速变体(每百万输入令牌 1.50 美元、每百万输出令牌 7.50 美元),默认启用快速选项,具体可参阅模型文档。
在性能方面,Composer 2 在所有测试基准上均实现大幅提升。根据官方数据,其在 CursorBench 上得分为 61.3%,Terminal-Bench 2.0 为 61.7%,SWE-bench Multilingual 为 73.7%,显著超越前代 Composer 1.5(分别为 44.2%、47.9%、65.9%)和 Composer 1(38.0%、40.0%、56.9%)。这些进步得益于 Cursor 首次实施的连续预训练,为强化学习提供了更坚实的基础。通过强化学习,Composer 2 能够在长周期任务中执行数百步操作,解决复杂编码问题。
值得注意的是,Terminal-Bench 2.0 是由 Laude Institute 维护的终端智能体评估基准。Anthropic 和 OpenAI 的模型得分分别使用 Claude Code 和 Simple Codex 框架计算,而 Cursor 得分则采用官方 Harbor 评估框架,默认设置,每个模型-智能体组合运行 5 次取平均值。其他模型的得分为官方排行榜分数与 Cursor 基础设施运行所得分数的最高值。
速度方面,所有模型的每秒令牌数(TPS)基于 2026 年 3 月 18 日的 Cursor 流量快照。Composer 与 GPT 模型的令牌大小相似,Anthropic 令牌约小 15%,TPS 已相应归一化。输出令牌价格也按同样比例调整。实际速度可能因提供商容量和后续改进而异。
对于个人套餐用户,Composer 使用计入独立用量池,并包含慷慨的免费额度。用户可立即在 Cursor 中体验 Composer 2,或通过新界面早期 alpha 版试用。Cursor 还同步发布了配套技术报告,详细介绍了模型训练方法。