2026-06-27 06:15 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

Cursor Composer 2 + Fireworks AI

Cursor 发布了 Composer 2，这是一款为 Cursor 开发环境优化的编码模型。它基于 Kimi 2.5，结合持续预训练和大规模强化学习，实现了前沿的编码性能，同时推理成本降低 6-10 倍。Fireworks AI 提供分布式推理基础设施，使强化学习规模化成为可能。

来源Fireworks AI Blog

近日，Cursor 正式发布了 Composer 2，这是一款专为其集成开发环境优化的专用编码模型。与依赖通用基础模型不同，Cursor 团队结合了持续预训练（continual pre-training）、大规模强化学习（RL）以及生产反馈循环，打造了一个能够通过实际开发者工作流程持续改进的模型。该模型基于 Kimi 2.5 构建，专注于长期软件工程任务，包括工具使用、调试、终端执行和多文件代码编辑。其结果是达到了前沿的编码性能，同时比更大的通用模型更具成本效益和可靠性。

强化学习在规模化过程中不再仅仅是一种建模技术，而是变成了基础设施问题。每次展开（rollout）相当于一次完整的开发会话，需要快速推理、一致的执行环境以及分布式集群间频繁的大型模型状态同步。训练稳定性、环境保真度和展开吞吐量都成为了一阶系统约束。Fireworks AI 提供了使这些强化学习循环变得实用的推理层，支持跨多个集群的分布式展开和推理基础设施。这使得 Cursor 能够在不构建和运营专用推理栈的情况下运行大规模强化学习，从而专注于改进模型行为而非底层系统扩展。

在性能方面，Composer 2 在 CursorBench 上达到 61.3，在 Terminal-Bench 上达到 61.7，在 SWE-bench Multilingual 上达到 73.7。推理成本相比同类前沿模型降低 6-10 倍。强化学习在 3-4 个全球集群上分布式运行，采用压缩权重同步而非完整模型传输，大大减少了跨区域同步的开销。生产推理能力在训练期间被复用，进一步加速了 RL 迭代。

Cursor 研究负责人 Federico Cassano 表示：“我们和其他公司一样工程师数量有限。我们更希望工程师专注于提高训练效率和精度，而不是另外开展推理工作。” Composer 2 的成功验证了一个更广泛的趋势：在人工智能领域，下一个优势不仅在于模型选择，更在于对后训练循环的掌控。通过将强化学习作为产品机制，Cursor 实现了模型在真实使用环境中的持续改进，而 Fireworks AI 的基础设施使这一规模化成为可能。

这一合作表明，前沿编码性能越来越依赖于强化学习系统而非单纯模型规模。Fireworks 通过提供可扩展、分布式且成本高效的推理基础设施，支持了这一转变。其结果是诞生了一种新型系统：在它们被使用的环境中持续改进的模型。拥有这一循环正在成为 AI 系统的决定性优势。