2026-05-15 11:34 UTC+8站内改写1 分钟阅读更新: 2026-06-27 08:25 UTC+8

Cursor 推出 Composer 2：前沿级编码模型，性价比最优

Cursor 发布 Composer 2 模型，在编码基准测试中达到前沿水平，定价为每百万输入令牌 0.50 美元、每百万输出令牌 2.50 美元，兼顾高性能与低成本。同时公开技术报告，详解训练方法。

Cursor 近日正式发布 Composer 2，这是一款达到前沿水平的编码模型，旨在以更优的性价比为用户提供顶级智能。该模型定价为每百万输入令牌 0.50 美元、每百万输出令牌 2.50 美元，同时提供相同智能水平的快速变体（每百万输入令牌 1.50 美元、每百万输出令牌 7.50 美元），默认启用快速选项，具体可参阅模型文档。

在性能方面，Composer 2 在所有测试基准上均实现大幅提升。根据官方数据，其在 CursorBench 上得分为 61.3%，Terminal-Bench 2.0 为 61.7%，SWE-bench Multilingual 为 73.7%，显著超越前代 Composer 1.5（分别为 44.2%、47.9%、65.9%）和 Composer 1（38.0%、40.0%、56.9%）。这些进步得益于 Cursor 首次实施的连续预训练，为强化学习提供了更坚实的基础。通过强化学习，Composer 2 能够在长周期任务中执行数百步操作，解决复杂编码问题。

值得注意的是，Terminal-Bench 2.0 是由 Laude Institute 维护的终端智能体评估基准。Anthropic 和 OpenAI 的模型得分分别使用 Claude Code 和 Simple Codex 框架计算，而 Cursor 得分则采用官方 Harbor 评估框架，默认设置，每个模型-智能体组合运行 5 次取平均值。其他模型的得分为官方排行榜分数与 Cursor 基础设施运行所得分数的最高值。

速度方面，所有模型的每秒令牌数（TPS）基于 2026 年 3 月 18 日的 Cursor 流量快照。Composer 与 GPT 模型的令牌大小相似，Anthropic 令牌约小 15%，TPS 已相应归一化。输出令牌价格也按同样比例调整。实际速度可能因提供商容量和后续改进而异。

对于个人套餐用户，Composer 使用计入独立用量池，并包含慷慨的免费额度。用户可立即在 Cursor 中体验 Composer 2，或通过新界面早期 alpha 版试用。Cursor 还同步发布了配套技术报告，详细介绍了模型训练方法。