AI News HubLIVE
站內改寫2 分鐘閱讀

使用自動安裝引導Composer · Cursor

Cursor團隊介紹了Composer中的自動安裝功能,該功能利用早期模型版本自動配置RL訓練環境,提高訓練效率。透過兩階段過程,模型能完成複雜的環境設定,並在實際專案中成功應用。此方法顯著提升了Composer 2在終端基準測試中的表現。

我們將介紹Cursor團隊開發的Composer自動安裝功能,該功能利用早期版本的Composer模型自動建立可執行的強化學習(RL)訓練環境。在訓練最新版本Composer 2時,團隊使用了其前身Composer 1.5來管理這一過程。自動安裝的核心目標是從未配置的倉庫檢出中自動建立工作環境,避免模型在除錯設定上浪費計算資源。

自動安裝的設計靈感來源於Cursor雲代理中的自動化環境設定功能。在RL訓練中,環境設定至關重要,因為Composer配備了全套工具,包括程式語言lint命令、搜尋功能和沙盒shell。若環境配置失敗,訓練效率將大打折扣,甚至無法獲得任何獎勵訊號。

自動安裝分為兩個階段。第一階段是“目標設定”:給Cursor代理一個固定版本的程式碼庫,要求其提出10個命令以及正確環境下應輸出的高階描述。代理會探索README、makefile,嘗試語言特定的命令如uv或clippy,並提出設定命令、測試和啟動命令。

第二階段中,另一個Composer代理接收初始環境狀態以及從10個命令中選出的3個目標命令。代理探索程式碼庫,呼叫工具設定環境使命令可執行。之後測試三個命令是否成功執行且輸出與描述匹配。若不成功,則重新開始第二階段。若重複5次仍未成功,則丟棄該環境。代理會盡力模擬缺失檔案、建立佔點陣圖片甚至偽造資料庫表來搭建完整環境。

為了驗證自動安裝的實際效果,團隊在真實專案Celo上進行了實驗。Celo是一個大型區塊鏈專案,具有多個主要依賴。在第一階段,代理閱讀文件和程式碼找到關鍵安裝命令,並透過網路搜尋補充資訊。第二階段中,代理需要讓這些命令實際執行,它發現需要安裝Foundry等其他依賴,並透過網路搜尋閱讀相關文件。第一次迭代中測試應用失敗,但第二次迭代透過建立模擬使用者成功啟動本地應用。

自動安裝顯著提升了Composer 2的效能。在Terminal-Bench基準測試中,Composer 2得分61.7%,而Composer 1.5為47.9%。這表明Composer 2為自動安裝提供了更好的基礎。未來,之前的Composer例項將在訓練過程中發揮更大作用,包括執行管理、資料預處理和架構調優。