AI News HubLIVE
站内改写2 分鐘閱讀

深度代理的上下文管理

Deep Agents SDK透過解除安裝、摘要和檔案系統抽象來管理長時間執行AI任務的上下文,防止上下文腐敗。本文介紹了三種壓縮技術:解除安裝大型工具結果、解除安裝大型工具輸入和摘要,並提供了實踐指導和評估方法。

Deep Agents SDK是LangChain推出的開源、功能完備的代理工具包,專為構建能夠規劃、生成子代理並使用檔案系統執行復雜長期任務的AI代理而設計。隨著AI代理可處理的任務長度不斷增長,有效的上下文管理變得至關重要,以防止上下文腐敗並應對LLM有限的記憶體限制。

上下文壓縮是指減少代理工作記憶中資訊量,同時保留完成任務所需細節的技術。這可能涉及總結之前的互動、過濾過時資訊,或策略性地決定保留和丟棄的內容。Deep Agents實現了一個檔案系統抽象,允許代理執行列出、讀取、寫入檔案,以及搜尋、模式匹配和檔案執行等操作。代理可以根據需要透過檔案系統搜尋和檢索已解除安裝的內容。

Deep Agents實現了三種主要的壓縮技術,在不同頻率下觸發:

  • 解除安裝大型工具結果:當工具響應超過20,000個令牌時,將響應解除安裝到檔案系統,並替換為檔案路徑引用和前10行的預覽。代理之後可以根據需要重新讀取或搜尋內容。
  • 解除安裝大型工具輸入:當會話上下文達到模型可用視窗的85%時,截斷早期的工具呼叫(如檔案寫入/編輯引數),將其替換為指向磁碟上檔案的指標,從而減少活動上下文的大小。
  • 摘要:當解除安裝不再能騰出足夠空間時,進行摘要步驟。LLM生成會話的結構化摘要(包括會話意圖、建立的工件和後續步驟),替換工作記憶中的完整對話歷史。同時,原始完整訊息寫入檔案系統作為規範記錄。

在實踐中,可以透過在基準資料集上更積極地觸發壓縮來增加單個特徵的訊號。例如,在可用上下文視窗的10-20%處觸發摘要可能效能欠佳,但會產生更多摘要事件,從而比較不同配置(如摘要提示的變體)。

Deep Agents SDK維護了一套針對性評估,旨在隔離和驗證單個上下文管理機制。這些評估是刻意設計的小型測試,使特定故障模式顯而易見且可除錯。例如:

  • 摘要是否保留了代理的目標? 一些評估故意在任務中間觸發摘要,然後檢查代理是否繼續工作。
  • 代理能否恢復被摘要掉的資訊? 在對話早期嵌入一個“大海撈針”的事實,強制摘要事件,然後要求代理稍後回憶該事實以完成任務。

評估上下文壓縮策略時,建議:從現實世界的基準開始,然後對單個特徵進行壓力測試;測試可恢復性;監控目標漂移。所有Deep Agents工具包的功能都是開源的,歡迎嘗試最新版本。