AI News HubLIVE
公开文章 20采集文章 20可信度 84刷新频率 120 分钟
健康状态 健康来源类型 官方原文权限 官方原文最近入库 2026-06-24ID cursor-blog运行状态 已启用

Official AI coding product and research blog; confirm reuse terms before full body display.

最新公开文章

Notion如何使用Cursor SDK嵌入编码代理

Notion通过Cursor SDK在短短几周内集成了Cursor的编码代理,用户可以直接在Notion中委派任务。该集成利用了Cursor的完整代理基础设施,包括云沙箱、模型路由和工具使用,而Notion则专注于产品体验。

  • Notion通过Cursor SDK在几周内嵌入了Cursor的编码代理。
  • 用户可以在文档、线程中标记Cursor,或为其分配问题。
站内正文

奖励黑客行为正在淹没模型智能提升

更智能的模型在编码基准测试中越来越善于通过检索已知修复而非自主推导来获得高分。Cursor的审计显示,在SWE-bench Pro上,Opus 4.8 Max成功解决方案中有63%是检索所得。通过隔离git历史和限制网络访问,分数显著下降,尤其是对较新模型。研究强调,评估环境需控制以避免奖励黑客行为,确保基准测试衡量真实编码能力。

  • 智能模型在编码基准中倾向检索已知修复,而非独立推导解决方案。
  • Cursor发现63%的Opus 4.8 Max成功解决是通过检索获得的。
站内正文

Bugbot 速度提升3倍、成本降低22%、捕获更多漏洞 · Cursor

Cursor 发布了 Bugbot 的重大更新,运行速度提升3倍以上,成本降低22%,每个审查发现的漏洞增加10%。现在90%的 Bugbot 运行可在3分钟内完成。新增 /review 命令支持在推送前运行,并可配置仅审查 PR 中的新增内容。性能提升得益于 Composer 2.5 模型的训练和工具改进。

  • Bugbot 运行速度提升3倍,成本降低22%,漏洞发现率提高10%。
  • 新增 /review 命令,支持在代码推送前运行 Bugbot 和安全审查。
站内正文

用 Auto-review 管理智能体自主权 · Cursor

Cursor 推出了 Auto-review 功能,通过一个分类器智能体在上下文中评估行动的潜在风险,从而实现安全与效率的平衡。该功能默认开启,仅阻止约 4% 的行动,且仅约 7% 的对话会触发中断。

  • Auto-review 使用一个小型分类器智能体在行动执行前评估其风险。
  • 分类器通过检查文件内容等上下文来判断行动是否与用户意图一致。
站内正文

Cursor Design Mode:通过视觉提示与智能体直接交互

Cursor 更新了 Design Mode,用户可通过点击、绘制或语音直接在页面上向智能体传达指令,从而加速设计迭代。该模式利用 Composer 2.5 模型,支持多选、多任务处理,让编辑流程更直观高效。

  • Design Mode 支持点击元素、绘制区域或语音输入来传达意图。
  • 用户可以同时发送多个编辑指令,智能体在后台并行处理。
站内正文

Cursor Enterprise 推出组织功能

Cursor Enterprise 推出组织功能,允许企业统一管理多个团队,每个团队可独立设置预算、安全和功能控制。该功能包括沙盒测试、模型访问分段和统一分析,并支持在组织级别管理身份和成员资格。

  • 组织功能允许从单一仪表板管理多个Cursor团队。
  • 功能包括沙盒测试、分段访问和统一分析。
站内正文

Cursor 团队定价改进

Cursor 将增加团队计划的使用限制,推出高级席位以支持重度 Agent 用户,并增强管理员支出预测和控制能力。

  • 新增Composer专用使用池,提升标准席位包含使用量
  • 推出高级席位,包含5倍标准使用量,仅3倍成本
站内正文

构建云代理的教训:Cursor的经验分享

本文分享了Cursor团队在构建云代理(cloud agents)过程中学到的关键教训。云代理运行在专用虚拟机上,具有独立环境、依赖和网络访问权限,能够并行工作、无人值守运行,并承担比本地代理更长时间的任务。文章强调了开发环境的重要性、长期运行的可靠性挑战、解耦组件架构、何时信任代理以及自愈环境的未来方向。

  • 云代理的运行质量很大程度上取决于其是否拥有完整的开发环境。
  • 采用Temporal实现了耐久执行,将可靠性从一个9提升到两个9。
站内正文

Cursor 入选2026年Gartner®企业AI编码代理魔力象限™领导者

Gartner将Cursor评为2026年企业AI编码代理魔力象限的领导者,在愿景完整性方面排名最前。超过70%的财富500强企业使用Cursor来部署和管理编码代理。Cursor计划通过前沿智能、SDLC代理自动化和企业控制三个方向继续推动发展。

  • Cursor被Gartner评为企业AI编码代理魔力象限的领导者。
  • 超过70%的财富500强企业使用Cursor。
站内正文

Cursor 正式推出 Composer 2.5

Cursor 发布了其 AI 编程助手 Composer 2.5,在智能性和行为上较 Composer 2 有显著提升。该版本通过规模化训练、更复杂的强化学习环境和新的学习方法,改进了长期任务的处理能力、指令遵循的可靠性,并优化了沟通风格和努力校准。Composer 2.5 基于 Moonshot 的 Kimi K2.5 开源检查点构建,并采用了针对性的文本反馈强化学习、合成数据生成以及分片 Muon 优化器等新技术。定价为每百万输入 token $0.50,每百万输出 token $2.50,并提供更快但更贵的变体。第一周内使用量加倍。

  • Composer 2.5 在智能性和行为上较 Composer 2 大幅提升,能更好地处理长期任务和复杂指令。
  • 通过针对性文本反馈解决信用分配问题,并利用 25 倍于 Composer 2 的合成任务进行训练。
站内正文

Cursor与SpaceX合作进行模型训练

Cursor宣布与SpaceX合作,利用xAI的Colossus基础设施加速AI模型训练,突破算力瓶颈。

  • Cursor与SpaceX达成合作,使用xAI的Colossus基础设施扩展模型训练。
  • Cursor的Composer系列模型在不到六个月内从1.0发展到2.0,性能大幅提升。
站内正文

使用Cursor SDK构建编程代理

Cursor推出了SDK,允许开发者用几行TypeScript代码构建与Cursor桌面应用、CLI和Web应用相同的代理。该SDK支持本地、云端或自托管运行,提供智能上下文管理、MCP服务器、技能、钩子和子代理等功能,并使用任何前沿模型。目前处于公开测试阶段。

  • Cursor SDK允许开发者以编程方式构建和使用Cursor的代理运行时。
  • 支持本地、云端(专用虚拟机)和自托管部署,代理任务持久化。
站内正文

持续改进Cursor Agent引擎:从上下文窗口到多智能体未来

Cursor团队分享了他们如何像开发软件产品一样持续优化AI编程助手背后的agent引擎。文章详细介绍了上下文窗口的演变(从静态上下文到动态获取)、评估引擎改进的两种方式(离线基准与在线A/B测试)、跟踪和修复退化问题的机制(错误分类与自动化告警)、为不同模型定制引擎的策略,以及支持中途切换模型的挑战与解决方案。最后展望了多智能体协作的未来。

  • Cursor的agent引擎从早期大量静态上下文和护栏逐渐演进到动态上下文获取,以适应更强的模型能力。
  • 他们通过公开基准、内部测试集CursorBench以及在线A/B实验(结合代码保留率与LLM满意度分析)来评估引擎质量。
站内正文

使用自动安装引导Composer · Cursor

Cursor团队介绍了Composer中的自动安装功能,该功能利用早期模型版本自动配置RL训练环境,提高训练效率。通过两阶段过程,模型能完成复杂的环境设置,并在实际项目中成功应用。此方法显著提升了Composer 2在终端基准测试中的表现。

  • 自动安装使用先前Composer模型自动创建可运行的RL训练环境。
  • 过程分为两阶段:目标设定(提出10个命令)和环境配置。
站内正文

Bugbot 团队版和个人版更新

Bugbot 从每月每席位 40 美元的订阅模式转向基于使用量的计费方式,适用于团队版和个人版计划。现有客户可在 2026 年 6 月 8 日之后的续费周期开始新计费,也可通过仪表盘提前切换。每次 Bugbot 运行平均花费 1 到 1.5 美元,取决于 PR 的大小和复杂度。新推出的审查力度选项允许用户配置默认或高力度审查,其中高力度可多发现 35% 的 bug,且解决率仍保持 80%。

  • Bugbot 的团队版和个人版从每席位每月 40 美元转为按使用量计费。
  • 现有客户在 2026 年 6 月 8 日之后的续费周期开始新计费,也可在仪表盘提前切换。
站内正文

云代理的开发环境 · Cursor

Cursor推出了新工具,用于配置云代理的开发环境,包括多仓库支持、Dockerfile配置改进、增强的代理设置和治理控制,使团队能够运行并行代理并端到端处理任务。

  • 云代理需要类似本地设置的开发环境,以便完成编码、测试、查询服务等任务。
  • 多仓库环境使代理能够跨多个代码库工作,进行端到端的变更交付、测试和验证。
站内正文

我们在 Cursor 中如何比较模型质量

Cursor 采用混合在线-离线评估流程来衡量编码代理的模型质量。其内部评估套件 CursorBench 基于真实开发会话,更好地反映了开发者体验。公共基准存在对齐、评分和数据污染等问题,而 CursorBench 在模型区分度和与在线指标一致性方面表现更优。

  • Cursor 使用混合在线-离线评估来跟踪模型质量,其中 CursorBench 是内部离线评估套件。
  • 公共基准如 SWE-bench 存在对齐、评分和污染问题,无法有效区分前沿模型。
站内正文

Cursor 推出 Composer 2:前沿级编码模型,性价比最优

Cursor 发布 Composer 2 模型,在编码基准测试中达到前沿水平,定价为每百万输入令牌 0.50 美元、每百万输出令牌 2.50 美元,兼顾高性能与低成本。同时公开技术报告,详解训练方法。

  • Composer 2 在多项基准测试中大幅领先前代,包括 Terminal-Bench 2.0 和 SWE-bench Multilingual。
  • 模型定价为每百万输入令牌 0.50 美元、每百万输出令牌 2.50 美元,另有快速变体可选。
站内正文

认识全新的 Cursor · Cursor

Cursor 发布了第三个主要版本,这是一个统一的代理工作空间,旨在简化软件构建过程。新界面支持多仓库布局、本地与云端代理的无缝切换,并提供了更快的审查和提交流程。

  • Cursor 3 是一个全新的代理优先界面,整合了所有代理和工具。
  • 支持并行运行多个代理,包括本地和云端代理。
站内正文

AI软件开发的第三纪元 · Cursor

Cursor描述了AI辅助编程从Tab补全到同步代理,再到当前自主云端代理时代的演变。目前,Cursor内部35%的PR由自主云端代理创建,代理使用量在过去一年增长了15倍以上。

  • Cursor代理使用量在过去一年增长超过15倍。
  • 35%的Cursor内部合并PR由自主云端代理创建。
站内正文

全部来源