AI News HubLIVE
站内改写2 分钟阅读

Cursor Composer 2 + Fireworks AI

Cursor 发布了 Composer 2,这是一款为 Cursor 开发环境优化的编码模型。它基于 Kimi 2.5,结合持续预训练和大规模强化学习,实现了前沿的编码性能,同时推理成本降低 6-10 倍。Fireworks AI 提供分布式推理基础设施,使强化学习规模化成为可能。

近日,Cursor 正式发布了 Composer 2,这是一款专为其集成开发环境优化的专用编码模型。与依赖通用基础模型不同,Cursor 团队结合了持续预训练(continual pre-training)、大规模强化学习(RL)以及生产反馈循环,打造了一个能够通过实际开发者工作流程持续改进的模型。该模型基于 Kimi 2.5 构建,专注于长期软件工程任务,包括工具使用、调试、终端执行和多文件代码编辑。其结果是达到了前沿的编码性能,同时比更大的通用模型更具成本效益和可靠性。

强化学习在规模化过程中不再仅仅是一种建模技术,而是变成了基础设施问题。每次展开(rollout)相当于一次完整的开发会话,需要快速推理、一致的执行环境以及分布式集群间频繁的大型模型状态同步。训练稳定性、环境保真度和展开吞吐量都成为了一阶系统约束。Fireworks AI 提供了使这些强化学习循环变得实用的推理层,支持跨多个集群的分布式展开和推理基础设施。这使得 Cursor 能够在不构建和运营专用推理栈的情况下运行大规模强化学习,从而专注于改进模型行为而非底层系统扩展。

在性能方面,Composer 2 在 CursorBench 上达到 61.3,在 Terminal-Bench 上达到 61.7,在 SWE-bench Multilingual 上达到 73.7。推理成本相比同类前沿模型降低 6-10 倍。强化学习在 3-4 个全球集群上分布式运行,采用压缩权重同步而非完整模型传输,大大减少了跨区域同步的开销。生产推理能力在训练期间被复用,进一步加速了 RL 迭代。

Cursor 研究负责人 Federico Cassano 表示:“我们和其他公司一样工程师数量有限。我们更希望工程师专注于提高训练效率和精度,而不是另外开展推理工作。” Composer 2 的成功验证了一个更广泛的趋势:在人工智能领域,下一个优势不仅在于模型选择,更在于对后训练循环的掌控。通过将强化学习作为产品机制,Cursor 实现了模型在真实使用环境中的持续改进,而 Fireworks AI 的基础设施使这一规模化成为可能。

这一合作表明,前沿编码性能越来越依赖于强化学习系统而非单纯模型规模。Fireworks 通过提供可扩展、分布式且成本高效的推理基础设施,支持了这一转变。其结果是诞生了一种新型系统:在它们被使用的环境中持续改进的模型。拥有这一循环正在成为 AI 系统的决定性优势。