Memora:平衡抽象与具体性的和谐记忆表示
AI 代理无法记住过去的交互,需要不断加载上下文。Memora 通过解耦存储与检索,实现可扩展的记忆系统,在长上下文基准测试中达到最先进性能,同时减少高达 98% 的令牌消耗。
现代AI智能体面临一个根本性缺陷:它们缺乏持久记忆。每次对话开始,模型都从零开始,无法保留之前交互中的关键信息。随着任务周期延长,这种无状态特性成为效率瓶颈。微软研究院提出的Memora系统通过精心设计的记忆架构解决了这一问题,在保持高精度的同时大幅降低计算开销。
Memora的核心创新在于将记忆的内容与检索方式分离。传统方法要么直接存储原始文本(导致碎片化),要么压缩成模糊摘要(丢失细节)。Memora为每条记忆分配一个“主抽象”(primary abstraction)——一个6-8个词的短语作为检索入口,而详细内容则保存在“记忆值”中。此外,“线索锚点”(cue anchors)作为辅助标签,提供多样化的访问路径。这种设计使系统既能高效索引,又能保留完整细节。
在具体应用中,例如用户讨论项目里程碑时,Memora会创建主抽象“Dave和Sarah同意的Project Orion更新时间表”,而线索锚点如“Dave Project Orion更新”或“Project Orion原型计划”则允许从不同角度检索同一信息。这种灵活性避免了传统知识图谱需要预定义实体关系的限制。
Memora还引入了策略引导的检索器,通过迭代优化查询并利用线索锚点探索关联记忆,实现多跳推理。在LoCoMo(平均600轮对话)和LongMemEval(11.5万个令牌)基准测试中,Memora分别达到86.3%和87.4%的准确率,超越RAG、Mem0等现有方法。效率方面,它每段对话仅需存储344条记忆(Mem0需651条),令牌消耗比全上下文推理减少98%。
这项工作的意义超越了基准测试。它使AI助手能够进行长期协作,积累组织知识。未来的研究方向包括MemLoop(从失败中学习)、延迟记忆(推迟存储决策)和群组记忆(跨团队知识共享)。代码已开源,邀请社区共同探索无状态AI的终结。