AI News HubLIVE
站內改寫2 分鐘閱讀

使用自動安裝引導Composer · Cursor

Cursor團隊介紹了Composer中的自動安裝功能,該功能利用早期模型版本自動配置RL訓練環境,提高訓練效率。通過兩階段過程,模型能完成複雜的環境設置,並在實際項目中成功應用。此方法顯著提升了Composer 2在終端基準測試中的表現。

我們將介紹Cursor團隊開發的Composer自動安裝功能,該功能利用早期版本的Composer模型自動創建可運行的強化學習(RL)訓練環境。在訓練最新版本Composer 2時,團隊使用了其前身Composer 1.5來管理這一過程。自動安裝的核心目標是從未配置的倉庫檢出中自動建立工作環境,避免模型在調試設置上浪費計算資源。

自動安裝的設計靈感來源於Cursor雲代理中的自動化環境設置功能。在RL訓練中,環境設置至關重要,因為Composer配備了全套工具,包括編程語言lint命令、搜索功能和沙盒shell。若環境配置失敗,訓練效率將大打折扣,甚至無法獲得任何獎勵信號。

自動安裝分為兩個階段。第一階段是“目標設定”:給Cursor代理一個固定版本的代碼庫,要求其提出10個命令以及正確環境下應輸出的高級描述。代理會探索README、makefile,嘗試語言特定的命令如uv或clippy,並提出設置命令、測試和啓動命令。

第二階段中,另一個Composer代理接收初始環境狀態以及從10個命令中選出的3個目標命令。代理探索代碼庫,調用工具設置環境使命令可運行。之後測試三個命令是否成功執行且輸出與描述匹配。若不成功,則重新開始第二階段。若重複5次仍未成功,則丟棄該環境。代理會盡力模擬缺失文件、創建佔位圖片甚至偽造數據庫表來搭建完整環境。

為了驗證自動安裝的實際效果,團隊在真實項目Celo上進行了實驗。Celo是一個大型區塊鏈項目,具有多個主要依賴。在第一階段,代理閲讀文檔和代碼找到關鍵安裝命令,並通過網絡搜索補充信息。第二階段中,代理需要讓這些命令實際運行,它發現需要安裝Foundry等其他依賴,並通過網絡搜索閲讀相關文檔。第一次迭代中測試應用失敗,但第二次迭代通過創建模擬用户成功啓動本地應用。

自動安裝顯著提升了Composer 2的性能。在Terminal-Bench基準測試中,Composer 2得分61.7%,而Composer 1.5為47.9%。這表明Composer 2為自動安裝提供了更好的基礎。未來,之前的Composer實例將在訓練過程中發揮更大作用,包括運行管理、數據預處理和架構調優。