智能體‘牽引系統’解剖:模型如何變身自主工作引擎
瞭解代理牽引系統如何將AI模型轉變為自主工作引擎。探索核心組件:文件系統、沙箱和記憶。
文章情報
要點
- 分解複雜目標:規劃工具使代理能夠分解任務、跟蹤進度並根據學習情況調整。
- 並行委派工作:為獨立的子任務生成子代理,每個代理具有隔離的上下文。
為甚麼重要
這條新聞值得關注,因為分解複雜目標:規劃工具使代理能夠分解任務、跟蹤進度並根據學習情況調整。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
代理架構的核心公式是“代理 = 模型 + 牽引系統”。牽引系統是指除模型本身之外的每一行代碼、配置和執行邏輯。原始模型並非代理,但當牽引系統賦予其狀態、工具執行、反饋循環和可強制執行約束時,它便成為了代理。
牽引系統包含系統提示、工具與技能、MCP(模型上下文協議)及其描述、捆綁的基礎設施(如文件系統、沙箱、瀏覽器)、編排邏輯(子代理生成、交接、模型路由)以及用於確定性執行的鈎子/中間件(壓縮、延續、代碼檢查)。這種劃分迫使我們從模型智能的角度來設計系統。
**文件系統:持久存儲與上下文管理** 文件系統是牽引系統最基礎的原始要素。它賦予代理一個工作空間來讀取數據、代碼和文檔,使工作可以增量添加和卸載,無需將所有內容存儲在上下文中。代理可以存儲中間輸出,維護跨會話的狀態。文件系統還是自然的協作表面,多個代理和人類可以通過共享文件進行協調。Git為文件系統添加了版本控制,使代理能夠跟蹤工作、回滾錯誤和分支實驗。
**Bash與代碼:通用工具** 當前主要的代理執行模式是ReAct循環:模型推理、通過工具調用採取行動、觀察結果並重復。但牽引系統只能執行它擁有邏輯的工具。Bash+代碼執行使模型能夠自主設計自己的工具,而不受限於預先配置的固定工具集。這成為了自主問題解決的默認通用策略。
**沙箱:安全執行與驗證** 沙箱為代理提供安全的操作環境。牽引系統連接沙箱來運行代碼、檢查文件、安裝依賴並完成任務。這創建了安全、隔離的代碼執行。沙箱還通過按需創建環境、分派到多個任務並在完成後拆除來實現規模擴展。好的環境配有默認的工具,如語言運行時、包管理器、Git、瀏覽器和測試運行器,使代理能夠自我驗證。
**記憶與搜索:持續學習** 模型除了權重和當前上下文外沒有額外知識。牽引系統通過文件系統支持記憶文件標準(如AGENTS.md),在代理啓動時注入上下文。代理編輯該文件後,牽引系統將更新的文件加載到上下文中,實現持續學習。對於知識截止日期後的信息,網絡搜索和MCP工具(如Context7)幫助代理訪問最新數據。
**對抗上下文腐爛** 上下文腐爛指隨着上下文窗口填滿,模型推理能力下降。牽引系統通過壓縮智能地卸載和總結現有上下文,使代理能繼續工作。工具調用卸載將大工具輸出的頭尾保留,完整輸出存儲在文件系統中。技能通過漸進式披露解決上下文初始加載過多工具的問題。
**長時程自主執行** 長時程工作需要持久狀態、規劃、觀察和驗證。文件系統和Git跨會話跟蹤工作。Ralph循環通過鈎子攔截模型退出嘗試,在乾淨的上下文中重新注入原始提示,迫使代理繼續工作。規劃和自我驗證通過良好的提示和文件系統中的計劃文件實現。鈎子可運行預定義測試套件,失敗時循環回模型。
**牽引系統的未來** 模型訓練與牽引系統設計正日益耦合。現代代理產品(如Claude Code和Codex)在訓練後階段將模型與牽引系統循環結合,幫助模型改進牽引系統設計師認為應原生實現的動作。