AI代理記憶的三級難度解析
本文從三個難度級別解釋AI代理記憶:無狀態LLM代理的根本記憶問題,主要記憶類型(上下文內記憶和外部記憶),以及可擴展架構(包括寫入策略、檢索方法、衰減處理和多方代理一致性)。為構建能隨時間改進的代理提供實用見解。
無狀態AI代理每次請求都從零開始,這適用於孤立任務,但在需要追蹤決策、記住用户偏好或從中斷處繼續時成為問題。本文分三個層次解釋AI代理記憶,從基礎問題到大規模架構。
第一層:理解記憶問題。大語言模型(LLM)無持久狀態,每次API調用都是無狀態的。這引發四個關鍵問題:之前發生了什麼?用户想要什麼?代理嘗試過什麼?代理積累了哪些事實?記憶問題就是給無狀態系統賦予持久、可查詢的過去知識的能力。
第二層:記憶類型。上下文內記憶(工作記憶)包含當前上下文窗口中的一切,精確但受限於窗口大小。外部記憶通過檢索增強生成(RAG)實現,包括語義搜索和精確查找兩種模式。最健壯的代理記憶系統結合兩者。
第三層:可擴展架構。需要存儲事件記憶(具體事件)、語義記憶(事實和偏好)和程序記憶(行動模式)。寫入策略包括會話結束總結和事件觸發寫入,避免存儲原始轉錄或中間推理痕跡。檢索策略包括向量相似性搜索、結構化查詢和混合檢索。記憶衰減通過時間權重和版本化實體記錄處理。多方代理記憶通過中央記憶、命名空間或僅追加日誌保持一致性。評估指標包括檢索召回率、精確度、忠實度和陳舊率。
代理記憶像堆棧:上下文內記憶保持當前工作狀態,外部檢索帶來相關歷史和事實。工程挑戰在於確定記錄什麼、何時觸發檢索,以及如何維護乾淨有用的記憶。