2026-06-30 05:14 UTC+8站内改写1 分钟阅读更新: 2026-06-30 07:39 UTC+8

Memora：平衡抽象与具体性的和谐记忆表示

AI 代理无法记住过去的交互，需要不断加载上下文。Memora 通过解耦存储与检索，实现可扩展的记忆系统，在长上下文基准测试中达到最先进性能，同时减少高达 98% 的令牌消耗。

来源Microsoft Research Blog作者: Xuchao Zhang, Molly Xia, Mayukh Das, Anson Bastos, Chetan Bansal, Saravan Rajmohan

现代AI智能体面临一个根本性缺陷：它们缺乏持久记忆。每次对话开始，模型都从零开始，无法保留之前交互中的关键信息。随着任务周期延长，这种无状态特性成为效率瓶颈。微软研究院提出的Memora系统通过精心设计的记忆架构解决了这一问题，在保持高精度的同时大幅降低计算开销。

Memora的核心创新在于将记忆的内容与检索方式分离。传统方法要么直接存储原始文本（导致碎片化），要么压缩成模糊摘要（丢失细节）。Memora为每条记忆分配一个“主抽象”（primary abstraction）——一个6-8个词的短语作为检索入口，而详细内容则保存在“记忆值”中。此外，“线索锚点”（cue anchors）作为辅助标签，提供多样化的访问路径。这种设计使系统既能高效索引，又能保留完整细节。

在具体应用中，例如用户讨论项目里程碑时，Memora会创建主抽象“Dave和Sarah同意的Project Orion更新时间表”，而线索锚点如“Dave Project Orion更新”或“Project Orion原型计划”则允许从不同角度检索同一信息。这种灵活性避免了传统知识图谱需要预定义实体关系的限制。

Memora还引入了策略引导的检索器，通过迭代优化查询并利用线索锚点探索关联记忆，实现多跳推理。在LoCoMo（平均600轮对话）和LongMemEval（11.5万个令牌）基准测试中，Memora分别达到86.3%和87.4%的准确率，超越RAG、Mem0等现有方法。效率方面，它每段对话仅需存储344条记忆（Mem0需651条），令牌消耗比全上下文推理减少98%。

这项工作的意义超越了基准测试。它使AI助手能够进行长期协作，积累组织知识。未来的研究方向包括MemLoop（从失败中学习）、延迟记忆（推迟存储决策）和群组记忆（跨团队知识共享）。代码已开源，邀请社区共同探索无状态AI的终结。