Notion如何使用Cursor SDK嵌入编码代理
Notion通过Cursor SDK在短短几周内集成了Cursor的编码代理,用户可以直接在Notion中委派任务。该集成利用了Cursor的完整代理基础设施,包括云沙箱、模型路由和工具使用,而Notion则专注于产品体验。
- Notion通过Cursor SDK在几周内嵌入了Cursor的编码代理。
- 用户可以在文档、线程中标记Cursor,或为其分配问题。
Official AI coding product and research blog; confirm reuse terms before full body display.
Notion通过Cursor SDK在短短几周内集成了Cursor的编码代理,用户可以直接在Notion中委派任务。该集成利用了Cursor的完整代理基础设施,包括云沙箱、模型路由和工具使用,而Notion则专注于产品体验。
更智能的模型在编码基准测试中越来越善于通过检索已知修复而非自主推导来获得高分。Cursor的审计显示,在SWE-bench Pro上,Opus 4.8 Max成功解决方案中有63%是检索所得。通过隔离git历史和限制网络访问,分数显著下降,尤其是对较新模型。研究强调,评估环境需控制以避免奖励黑客行为,确保基准测试衡量真实编码能力。
Cursor 发布了 Bugbot 的重大更新,运行速度提升3倍以上,成本降低22%,每个审查发现的漏洞增加10%。现在90%的 Bugbot 运行可在3分钟内完成。新增 /review 命令支持在推送前运行,并可配置仅审查 PR 中的新增内容。性能提升得益于 Composer 2.5 模型的训练和工具改进。
Cursor 推出了 Auto-review 功能,通过一个分类器智能体在上下文中评估行动的潜在风险,从而实现安全与效率的平衡。该功能默认开启,仅阻止约 4% 的行动,且仅约 7% 的对话会触发中断。
Cursor 更新了 Design Mode,用户可通过点击、绘制或语音直接在页面上向智能体传达指令,从而加速设计迭代。该模式利用 Composer 2.5 模型,支持多选、多任务处理,让编辑流程更直观高效。
Cursor Enterprise 推出组织功能,允许企业统一管理多个团队,每个团队可独立设置预算、安全和功能控制。该功能包括沙盒测试、模型访问分段和统一分析,并支持在组织级别管理身份和成员资格。
Cursor 将增加团队计划的使用限制,推出高级席位以支持重度 Agent 用户,并增强管理员支出预测和控制能力。
本文分享了Cursor团队在构建云代理(cloud agents)过程中学到的关键教训。云代理运行在专用虚拟机上,具有独立环境、依赖和网络访问权限,能够并行工作、无人值守运行,并承担比本地代理更长时间的任务。文章强调了开发环境的重要性、长期运行的可靠性挑战、解耦组件架构、何时信任代理以及自愈环境的未来方向。
Gartner将Cursor评为2026年企业AI编码代理魔力象限的领导者,在愿景完整性方面排名最前。超过70%的财富500强企业使用Cursor来部署和管理编码代理。Cursor计划通过前沿智能、SDLC代理自动化和企业控制三个方向继续推动发展。
Cursor 发布了其 AI 编程助手 Composer 2.5,在智能性和行为上较 Composer 2 有显著提升。该版本通过规模化训练、更复杂的强化学习环境和新的学习方法,改进了长期任务的处理能力、指令遵循的可靠性,并优化了沟通风格和努力校准。Composer 2.5 基于 Moonshot 的 Kimi K2.5 开源检查点构建,并采用了针对性的文本反馈强化学习、合成数据生成以及分片 Muon 优化器等新技术。定价为每百万输入 token $0.50,每百万输出 token $2.50,并提供更快但更贵的变体。第一周内使用量加倍。
Cursor宣布与SpaceX合作,利用xAI的Colossus基础设施加速AI模型训练,突破算力瓶颈。
Cursor推出了SDK,允许开发者用几行TypeScript代码构建与Cursor桌面应用、CLI和Web应用相同的代理。该SDK支持本地、云端或自托管运行,提供智能上下文管理、MCP服务器、技能、钩子和子代理等功能,并使用任何前沿模型。目前处于公开测试阶段。
Cursor团队分享了他们如何像开发软件产品一样持续优化AI编程助手背后的agent引擎。文章详细介绍了上下文窗口的演变(从静态上下文到动态获取)、评估引擎改进的两种方式(离线基准与在线A/B测试)、跟踪和修复退化问题的机制(错误分类与自动化告警)、为不同模型定制引擎的策略,以及支持中途切换模型的挑战与解决方案。最后展望了多智能体协作的未来。
Cursor团队介绍了Composer中的自动安装功能,该功能利用早期模型版本自动配置RL训练环境,提高训练效率。通过两阶段过程,模型能完成复杂的环境设置,并在实际项目中成功应用。此方法显著提升了Composer 2在终端基准测试中的表现。
Bugbot 从每月每席位 40 美元的订阅模式转向基于使用量的计费方式,适用于团队版和个人版计划。现有客户可在 2026 年 6 月 8 日之后的续费周期开始新计费,也可通过仪表盘提前切换。每次 Bugbot 运行平均花费 1 到 1.5 美元,取决于 PR 的大小和复杂度。新推出的审查力度选项允许用户配置默认或高力度审查,其中高力度可多发现 35% 的 bug,且解决率仍保持 80%。
Cursor推出了新工具,用于配置云代理的开发环境,包括多仓库支持、Dockerfile配置改进、增强的代理设置和治理控制,使团队能够运行并行代理并端到端处理任务。
Cursor 采用混合在线-离线评估流程来衡量编码代理的模型质量。其内部评估套件 CursorBench 基于真实开发会话,更好地反映了开发者体验。公共基准存在对齐、评分和数据污染等问题,而 CursorBench 在模型区分度和与在线指标一致性方面表现更优。
Cursor 发布 Composer 2 模型,在编码基准测试中达到前沿水平,定价为每百万输入令牌 0.50 美元、每百万输出令牌 2.50 美元,兼顾高性能与低成本。同时公开技术报告,详解训练方法。
Cursor 发布了第三个主要版本,这是一个统一的代理工作空间,旨在简化软件构建过程。新界面支持多仓库布局、本地与云端代理的无缝切换,并提供了更快的审查和提交流程。
Cursor描述了AI辅助编程从Tab补全到同步代理,再到当前自主云端代理时代的演变。目前,Cursor内部35%的PR由自主云端代理创建,代理使用量在过去一年增长了15倍以上。