AI News HubLIVE
站内改写

智慧體‘牽引系統’解剖:模型如何變身自主工作引擎

瞭解代理牽引系統如何將AI模型轉變為自主工作引擎。探索核心元件:檔案系統、沙箱和記憶。

文章情報

工程師進階

要點

  • 分解複雜目標:規劃工具使代理能夠分解任務、跟蹤進度並根據學習情況調整。
  • 並行委派工作:為獨立的子任務生成子代理,每個代理具有隔離的上下文。

為什麼重要

這條新聞值得關注,因為分解複雜目標:規劃工具使代理能夠分解任務、跟蹤進度並根據學習情況調整。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

代理架構的核心公式是“代理 = 模型 + 牽引系統”。牽引系統是指除模型本身之外的每一行程式碼、配置和執行邏輯。原始模型並非代理,但當牽引系統賦予其狀態、工具執行、反饋迴圈和可強制執行約束時,它便成為了代理。

牽引系統包含系統提示、工具與技能、MCP(模型上下文協議)及其描述、捆綁的基礎設施(如檔案系統、沙箱、瀏覽器)、編排邏輯(子代理生成、交接、模型路由)以及用於確定性執行的鉤子/中介軟體(壓縮、延續、程式碼檢查)。這種劃分迫使我們從模型智慧的角度來設計系統。

**檔案系統:持久儲存與上下文管理** 檔案系統是牽引系統最基礎的原始要素。它賦予代理一個工作空間來讀取資料、程式碼和文件,使工作可以增量新增和解除安裝,無需將所有內容儲存在上下文中。代理可以儲存中間輸出,維護跨會話的狀態。檔案系統還是自然的協作表面,多個代理和人類可以透過共享檔案進行協調。Git為檔案系統新增了版本控制,使代理能夠跟蹤工作、回滾錯誤和分支實驗。

**Bash與程式碼:通用工具** 當前主要的代理執行模式是ReAct迴圈:模型推理、透過工具呼叫採取行動、觀察結果並重復。但牽引系統只能執行它擁有邏輯的工具。Bash+程式碼執行使模型能夠自主設計自己的工具,而不受限於預先配置的固定工具集。這成為了自主問題解決的預設通用策略。

**沙箱:安全執行與驗證** 沙箱為代理提供安全的操作環境。牽引系統連線沙箱來執行程式碼、檢查檔案、安裝依賴並完成任務。這建立了安全、隔離的程式碼執行。沙箱還透過按需建立環境、分派到多個任務並在完成後拆除來實現規模擴充套件。好的環境配有預設的工具,如語言執行時、包管理器、Git、瀏覽器和測試執行器,使代理能夠自我驗證。

**記憶與搜尋:持續學習** 模型除了權重和當前上下文外沒有額外知識。牽引系統透過檔案系統支援記憶檔案標準(如AGENTS.md),在代理啟動時注入上下文。代理編輯該檔案後,牽引系統將更新的檔案載入到上下文中,實現持續學習。對於知識截止日期後的資訊,網路搜尋和MCP工具(如Context7)幫助代理訪問最新資料。

**對抗上下文腐爛** 上下文腐爛指隨著上下文視窗填滿,模型推理能力下降。牽引系統透過壓縮智慧地解除安裝和總結現有上下文,使代理能繼續工作。工具呼叫解除安裝將大工具輸出的頭尾保留,完整輸出儲存在檔案系統中。技能透過漸進式披露解決上下文初始載入過多工具的問題。

**長時程自主執行** 長時程工作需要持久狀態、規劃、觀察和驗證。檔案系統和Git跨會話跟蹤工作。Ralph迴圈透過鉤子攔截模型退出嘗試,在乾淨的上下文中重新注入原始提示,迫使代理繼續工作。規劃和自我驗證透過良好的提示和檔案系統中的計劃檔案實現。鉤子可執行預定義測試套件,失敗時迴圈回模型。

**牽引系統的未來** 模型訓練與牽引系統設計正日益耦合。現代代理產品(如Claude Code和Codex)在訓練後階段將模型與牽引系統迴圈結合,幫助模型改進牽引系統設計師認為應原生實現的動作。