AI News HubLIVE
站內改寫1 分鐘閱讀

Memora:平衡抽象與具體性的和諧記憶表示

AI 代理無法記住過去的交互,需要不斷加載上下文。Memora 通過解耦存儲與檢索,實現可擴展的記憶系統,在長上下文基準測試中達到最先進性能,同時減少高達 98% 的令牌消耗。

來源Microsoft Research Blog作者: Xuchao Zhang, Molly Xia, Mayukh Das, Anson Bastos, Chetan Bansal, Saravan Rajmohan

現代AI智能體面臨一個根本性缺陷:它們缺乏持久記憶。每次對話開始,模型都從零開始,無法保留之前交互中的關鍵信息。隨着任務週期延長,這種無狀態特性成為效率瓶頸。微軟研究院提出的Memora系統通過精心設計的記憶架構解決了這一問題,在保持高精度的同時大幅降低計算開銷。

Memora的核心創新在於將記憶的內容與檢索方式分離。傳統方法要麼直接存儲原始文本(導致碎片化),要麼壓縮成模糊摘要(丟失細節)。Memora為每條記憶分配一個“主抽象”(primary abstraction)——一個6-8個詞的短語作為檢索入口,而詳細內容則保存在“記憶值”中。此外,“線索錨點”(cue anchors)作為輔助標籤,提供多樣化的訪問路徑。這種設計使系統既能高效索引,又能保留完整細節。

在具體應用中,例如用户討論項目里程碑時,Memora會創建主抽象“Dave和Sarah同意的Project Orion更新時間表”,而線索錨點如“Dave Project Orion更新”或“Project Orion原型計劃”則允許從不同角度檢索同一信息。這種靈活性避免了傳統知識圖譜需要預定義實體關係的限制。

Memora還引入了策略引導的檢索器,通過迭代優化查詢並利用線索錨點探索關聯記憶,實現多跳推理。在LoCoMo(平均600輪對話)和LongMemEval(11.5萬個令牌)基準測試中,Memora分別達到86.3%和87.4%的準確率,超越RAG、Mem0等現有方法。效率方面,它每段對話僅需存儲344條記憶(Mem0需651條),令牌消耗比全上下文推理減少98%。

這項工作的意義超越了基準測試。它使AI助手能夠進行長期協作,積累組織知識。未來的研究方向包括MemLoop(從失敗中學習)、延遲記憶(推遲存儲決策)和羣組記憶(跨團隊知識共享)。代碼已開源,邀請社區共同探索無狀態AI的終結。