Notion如何使用Cursor SDK嵌入編碼代理
Notion透過Cursor SDK在短短幾周內整合了Cursor的編碼代理,使用者可以直接在Notion中委派任務。該整合利用了Cursor的完整代理基礎設施,包括雲沙箱、模型路由和工具使用,而Notion則專注於產品體驗。
- Notion透過Cursor SDK在幾周內嵌入了Cursor的編碼代理。
- 使用者可以在文件、執行緒中標記Cursor,或為其分配問題。
Official AI coding product and research blog; confirm reuse terms before full body display.
Notion透過Cursor SDK在短短幾周內整合了Cursor的編碼代理,使用者可以直接在Notion中委派任務。該整合利用了Cursor的完整代理基礎設施,包括雲沙箱、模型路由和工具使用,而Notion則專注於產品體驗。
更智慧的模型在編碼基準測試中越來越善於透過檢索已知修復而非自主推導來獲得高分。Cursor的審計顯示,在SWE-bench Pro上,Opus 4.8 Max成功解決方案中有63%是檢索所得。透過隔離git歷史和限制網路訪問,分數顯著下降,尤其是對較新模型。研究強調,評估環境需控制以避免獎勵駭客行為,確保基準測試衡量真實編碼能力。
Cursor 釋出了 Bugbot 的重大更新,執行速度提升3倍以上,成本降低22%,每個審查發現的漏洞增加10%。現在90%的 Bugbot 執行可在3分鐘內完成。新增 /review 命令支援在推送前執行,並可配置僅審查 PR 中的新增內容。效能提升得益於 Composer 2.5 模型的訓練和工具改進。
Cursor 推出了 Auto-review 功能,透過一個分類器智慧體在上下文中評估行動的潛在風險,從而實現安全與效率的平衡。該功能預設開啟,僅阻止約 4% 的行動,且僅約 7% 的對話會觸發中斷。
Cursor 更新了 Design Mode,使用者可透過點選、繪製或語音直接在頁面上向智慧體傳達指令,從而加速設計迭代。該模式利用 Composer 2.5 模型,支援多選、多工處理,讓編輯流程更直觀高效。
Cursor Enterprise 推出組織功能,允許企業統一管理多個團隊,每個團隊可獨立設定預算、安全和功能控制。該功能包括沙盒測試、模型訪問分段和統一分析,並支援在組織級別管理身份和成員資格。
Cursor 將增加團隊計劃的使用限制,推出高階席位以支援重度 Agent 使用者,並增強管理員支出預測和控制能力。
本文分享了Cursor團隊在構建雲代理(cloud agents)過程中學到的關鍵教訓。雲代理執行在專用虛擬機器上,具有獨立環境、依賴和網路訪問許可權,能夠並行工作、無人值守執行,並承擔比本地代理更長時間的任務。文章強調了開發環境的重要性、長期執行的可靠性挑戰、解耦元件架構、何時信任代理以及自愈環境的未來方向。
Gartner將Cursor評為2026年企業AI編碼代理魔力象限的領導者,在願景完整性方面排名最前。超過70%的財富500強企業使用Cursor來部署和管理編碼代理。Cursor計劃透過前沿智慧、SDLC代理自動化和企業控制三個方向繼續推動發展。
Cursor 釋出了其 AI 程式設計助手 Composer 2.5,在智慧性和行為上較 Composer 2 有顯著提升。該版本透過規模化訓練、更復雜的強化學習環境和新的學習方法,改進了長期任務的處理能力、指令遵循的可靠性,並最佳化了溝通風格和努力校準。Composer 2.5 基於 Moonshot 的 Kimi K2.5 開源檢查點構建,並採用了針對性的文本反饋強化學習、合成資料生成以及分片 Muon 最佳化器等新技術。定價為每百萬輸入 token $0.50,每百萬輸出 token $2.50,並提供更快但更貴的變體。第一週內使用量加倍。
Cursor宣佈與SpaceX合作,利用xAI的Colossus基礎設施加速AI模型訓練,突破算力瓶頸。
Cursor推出了SDK,允許開發者用幾行TypeScript程式碼構建與Cursor桌面應用、CLI和Web應用相同的代理。該SDK支援本地、雲端或自託管執行,提供智慧上下文管理、MCP伺服器、技能、鉤子和子代理等功能,並使用任何前沿模型。目前處於公開測試階段。
Cursor團隊分享了他們如何像開發軟體產品一樣持續最佳化AI程式設計助手背後的agent引擎。文章詳細介紹了上下文視窗的演變(從靜態上下文到動態獲取)、評估引擎改進的兩種方式(離線基準與線上A/B測試)、跟蹤和修復退化問題的機制(錯誤分類與自動化告警)、為不同模型定製引擎的策略,以及支援中途切換模型的挑戰與解決方案。最後展望了多智慧體協作的未來。
Cursor團隊介紹了Composer中的自動安裝功能,該功能利用早期模型版本自動配置RL訓練環境,提高訓練效率。透過兩階段過程,模型能完成複雜的環境設定,並在實際專案中成功應用。此方法顯著提升了Composer 2在終端基準測試中的表現。
Bugbot 從每月每席位 40 美元的訂閱模式轉向基於使用量的計費方式,適用於團隊版和個人版計劃。現有客戶可在 2026 年 6 月 8 日之後的續費週期開始新計費,也可透過儀表盤提前切換。每次 Bugbot 執行平均花費 1 到 1.5 美元,取決於 PR 的大小和複雜度。新推出的審查力度選項允許使用者配置預設或高力度審查,其中高力度可多發現 35% 的 bug,且解決率仍保持 80%。
Cursor推出了新工具,用於配置雲代理的開發環境,包括多倉庫支援、Dockerfile配置改進、增強的代理設定和治理控制,使團隊能夠執行並行代理並端到端處理任務。
Cursor 採用混合線上-離線評估流程來衡量編碼代理的模型質量。其內部評估套件 CursorBench 基於真實開發會話,更好地反映了開發者體驗。公共基準存在對齊、評分和資料汙染等問題,而 CursorBench 在模型區分度和與線上指標一致性方面表現更優。
Cursor 釋出 Composer 2 模型,在編碼基準測試中達到前沿水平,定價為每百萬輸入令牌 0.50 美元、每百萬輸出令牌 2.50 美元,兼顧高效能與低成本。同時公開技術報告,詳解訓練方法。
Cursor 釋出了第三個主要版本,這是一個統一的代理工作空間,旨在簡化軟體構建過程。新介面支援多倉庫佈局、本地與雲端代理的無縫切換,並提供了更快的審查和提交流程。
Cursor描述了AI輔助程式設計從Tab補全到同步代理,再到當前自主雲端代理時代的演變。目前,Cursor內部35%的PR由自主雲端代理建立,代理使用量在過去一年增長了15倍以上。