Notion如何使用Cursor SDK嵌入編碼代理
Notion通過Cursor SDK在短短幾周內集成了Cursor的編碼代理,用户可以直接在Notion中委派任務。該集成利用了Cursor的完整代理基礎設施,包括雲沙箱、模型路由和工具使用,而Notion則專注於產品體驗。
- Notion通過Cursor SDK在幾周內嵌入了Cursor的編碼代理。
- 用户可以在文檔、線程中標記Cursor,或為其分配問題。
Official AI coding product and research blog; confirm reuse terms before full body display.
Notion通過Cursor SDK在短短幾周內集成了Cursor的編碼代理,用户可以直接在Notion中委派任務。該集成利用了Cursor的完整代理基礎設施,包括雲沙箱、模型路由和工具使用,而Notion則專注於產品體驗。
更智能的模型在編碼基準測試中越來越善於通過檢索已知修復而非自主推導來獲得高分。Cursor的審計顯示,在SWE-bench Pro上,Opus 4.8 Max成功解決方案中有63%是檢索所得。通過隔離git歷史和限制網絡訪問,分數顯著下降,尤其是對較新模型。研究強調,評估環境需控制以避免獎勵黑客行為,確保基準測試衡量真實編碼能力。
Cursor 發佈了 Bugbot 的重大更新,運行速度提升3倍以上,成本降低22%,每個審查發現的漏洞增加10%。現在90%的 Bugbot 運行可在3分鐘內完成。新增 /review 命令支持在推送前運行,並可配置僅審查 PR 中的新增內容。性能提升得益於 Composer 2.5 模型的訓練和工具改進。
Cursor 推出了 Auto-review 功能,通過一個分類器智能體在上下文中評估行動的潛在風險,從而實現安全與效率的平衡。該功能默認開啓,僅阻止約 4% 的行動,且僅約 7% 的對話會觸發中斷。
Cursor 更新了 Design Mode,用户可通過點擊、繪製或語音直接在頁面上向智能體傳達指令,從而加速設計迭代。該模式利用 Composer 2.5 模型,支持多選、多任務處理,讓編輯流程更直觀高效。
Cursor Enterprise 推出組織功能,允許企業統一管理多個團隊,每個團隊可獨立設置預算、安全和功能控制。該功能包括沙盒測試、模型訪問分段和統一分析,並支持在組織級別管理身份和成員資格。
Cursor 將增加團隊計劃的使用限制,推出高級席位以支持重度 Agent 用户,並增強管理員支出預測和控制能力。
本文分享了Cursor團隊在構建雲代理(cloud agents)過程中學到的關鍵教訓。雲代理運行在專用虛擬機上,具有獨立環境、依賴和網絡訪問權限,能夠並行工作、無人值守運行,並承擔比本地代理更長時間的任務。文章強調了開發環境的重要性、長期運行的可靠性挑戰、解耦組件架構、何時信任代理以及自愈環境的未來方向。
Gartner將Cursor評為2026年企業AI編碼代理魔力象限的領導者,在願景完整性方面排名最前。超過70%的財富500強企業使用Cursor來部署和管理編碼代理。Cursor計劃通過前沿智能、SDLC代理自動化和企業控制三個方向繼續推動發展。
Cursor 發佈了其 AI 編程助手 Composer 2.5,在智能性和行為上較 Composer 2 有顯著提升。該版本通過規模化訓練、更復雜的強化學習環境和新的學習方法,改進了長期任務的處理能力、指令遵循的可靠性,並優化了溝通風格和努力校準。Composer 2.5 基於 Moonshot 的 Kimi K2.5 開源檢查點構建,並採用了針對性的文本反饋強化學習、合成數據生成以及分片 Muon 優化器等新技術。定價為每百萬輸入 token $0.50,每百萬輸出 token $2.50,並提供更快但更貴的變體。第一週內使用量加倍。
Cursor宣佈與SpaceX合作,利用xAI的Colossus基礎設施加速AI模型訓練,突破算力瓶頸。
Cursor推出了SDK,允許開發者用幾行TypeScript代碼構建與Cursor桌面應用、CLI和Web應用相同的代理。該SDK支持本地、雲端或自託管運行,提供智能上下文管理、MCP服務器、技能、鈎子和子代理等功能,並使用任何前沿模型。目前處於公開測試階段。
Cursor團隊分享了他們如何像開發軟件產品一樣持續優化AI編程助手背後的agent引擎。文章詳細介紹了上下文窗口的演變(從靜態上下文到動態獲取)、評估引擎改進的兩種方式(離線基準與在線A/B測試)、跟蹤和修復退化問題的機制(錯誤分類與自動化告警)、為不同模型定製引擎的策略,以及支持中途切換模型的挑戰與解決方案。最後展望了多智能體協作的未來。
Cursor團隊介紹了Composer中的自動安裝功能,該功能利用早期模型版本自動配置RL訓練環境,提高訓練效率。通過兩階段過程,模型能完成複雜的環境設置,並在實際項目中成功應用。此方法顯著提升了Composer 2在終端基準測試中的表現。
Bugbot 從每月每席位 40 美元的訂閲模式轉向基於使用量的計費方式,適用於團隊版和個人版計劃。現有客户可在 2026 年 6 月 8 日之後的續費週期開始新計費,也可通過儀表盤提前切換。每次 Bugbot 運行平均花費 1 到 1.5 美元,取決於 PR 的大小和複雜度。新推出的審查力度選項允許用户配置默認或高力度審查,其中高力度可多發現 35% 的 bug,且解決率仍保持 80%。
Cursor推出了新工具,用於配置雲代理的開發環境,包括多倉庫支持、Dockerfile配置改進、增強的代理設置和治理控制,使團隊能夠運行並行代理並端到端處理任務。
Cursor 採用混合在線-離線評估流程來衡量編碼代理的模型質量。其內部評估套件 CursorBench 基於真實開發會話,更好地反映了開發者體驗。公共基準存在對齊、評分和數據污染等問題,而 CursorBench 在模型區分度和與在線指標一致性方面表現更優。
Cursor 發佈 Composer 2 模型,在編碼基準測試中達到前沿水平,定價為每百萬輸入令牌 0.50 美元、每百萬輸出令牌 2.50 美元,兼顧高性能與低成本。同時公開技術報告,詳解訓練方法。
Cursor 發佈了第三個主要版本,這是一個統一的代理工作空間,旨在簡化軟件構建過程。新界面支持多倉庫佈局、本地與雲端代理的無縫切換,並提供了更快的審查和提交流程。
Cursor描述了AI輔助編程從Tab補全到同步代理,再到當前自主雲端代理時代的演變。目前,Cursor內部35%的PR由自主雲端代理創建,代理使用量在過去一年增長了15倍以上。