2026-06-30 05:14 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 07:39 UTC+8

Memora：平衡抽象與具體性的和諧記憶表示

AI 代理無法記住過去的交互，需要不斷加載上下文。Memora 通過解耦存儲與檢索，實現可擴展的記憶系統，在長上下文基準測試中達到最先進性能，同時減少高達 98% 的令牌消耗。

來源Microsoft Research Blog作者: Xuchao Zhang, Molly Xia, Mayukh Das, Anson Bastos, Chetan Bansal, Saravan Rajmohan

現代AI智能體面臨一個根本性缺陷：它們缺乏持久記憶。每次對話開始，模型都從零開始，無法保留之前交互中的關鍵信息。隨着任務週期延長，這種無狀態特性成為效率瓶頸。微軟研究院提出的Memora系統通過精心設計的記憶架構解決了這一問題，在保持高精度的同時大幅降低計算開銷。

Memora的核心創新在於將記憶的內容與檢索方式分離。傳統方法要麼直接存儲原始文本（導致碎片化），要麼壓縮成模糊摘要（丟失細節）。Memora為每條記憶分配一個“主抽象”（primary abstraction）——一個6-8個詞的短語作為檢索入口，而詳細內容則保存在“記憶值”中。此外，“線索錨點”（cue anchors）作為輔助標籤，提供多樣化的訪問路徑。這種設計使系統既能高效索引，又能保留完整細節。

在具體應用中，例如用户討論項目里程碑時，Memora會創建主抽象“Dave和Sarah同意的Project Orion更新時間表”，而線索錨點如“Dave Project Orion更新”或“Project Orion原型計劃”則允許從不同角度檢索同一信息。這種靈活性避免了傳統知識圖譜需要預定義實體關係的限制。

Memora還引入了策略引導的檢索器，通過迭代優化查詢並利用線索錨點探索關聯記憶，實現多跳推理。在LoCoMo（平均600輪對話）和LongMemEval（11.5萬個令牌）基準測試中，Memora分別達到86.3%和87.4%的準確率，超越RAG、Mem0等現有方法。效率方面，它每段對話僅需存儲344條記憶（Mem0需651條），令牌消耗比全上下文推理減少98%。

這項工作的意義超越了基準測試。它使AI助手能夠進行長期協作，積累組織知識。未來的研究方向包括MemLoop（從失敗中學習）、延遲記憶（推遲存儲決策）和羣組記憶（跨團隊知識共享）。代碼已開源，邀請社區共同探索無狀態AI的終結。