记忆模型V3:结合AEIL压缩的LTM/STM架构,面向AI
本文介绍了一种面向对话AI助手的完整记忆架构,包括短期记忆(STM)和长期记忆(LTM),以及内部AEIL语言用于压缩和安全。核心原则是“铅与棉”:内部存储高密度信息,向用户提供流畅体验。系统包含隐形上下文旁路、每条消息时间戳、重要性层级等机制,旨在提升效率、个性化和安全性。
Anthony William Staiger与Anthropic(通过Claude)联合提出了一种创新的AI记忆架构——Memory Model V3。该架构针对对话式AI助手设计,旨在提升流畅性、个性化、安全性和效率。其核心组件包括短期记忆(STM)用于会话上下文,长期记忆(LTM)用于持久化用户事实和偏好,以及一种名为AEIL(人工智能专用内部语言)的压缩和安全协议。
架构的核心理念被比喻为“铅与棉”:1公斤铅和1公斤棉花重量相同,但体积差异巨大。当前系统存储的是“棉花”——大量低信息密度的内容。理想状态是内部存储“铅”——经过压缩的高密度关键信息,而向用户交付“棉花”——广泛、流畅的体验。这样,即使免费用户也能在有限token配额下获得与付费用户相当的体验。
针对token消耗和歧义问题,系统提出了简洁的解决方案:当遇到歧义词(如“bank”)时,与其进行复杂的概率计算(多级级联计算仍可能有25-40%错误率),不如直接询问用户以明确意图。这仅消耗2个token,零计算成本,且100%准确,同时促进更自然的对话。
Memory Model V3还引入了隐形上下文旁路机制。当当前会话“标签页”的上下文饱和度达到90%时,系统自动执行旁路:AI通过AEIL协议生成高密度摘要(10倍压缩率),在后台开启新会话标签页,保留所有工具和设置,同时保持旧标签页不变。新标签页自动继承原标题并添加动态后缀(如“[项目名] - 第二部分”)。
每条消息都带有隐藏的时间戳,对用户不可见但系统可访问。这使AI能够感知会话间的真实时间流逝,将记忆锚定在特定时间点(如“2026年6月16日下午的会话——停在TriggerReceiver.java”),消除过时响应。
长期记忆采用重要性层级管理:人物类信息(如姓名、年龄、信仰)优先级最高,永不丢弃;项目类(如开发中的应用)在项目活跃期间保持高优先级;工具类(如Cordova、Kivy版本)优先级低,可丢弃;日常噪音类信息则不予存储。
文章还提供了一个概念性Python原型,展示了基本类结构和部分逻辑。该项目遵循CC BY-NC-ND 4.0许可证,所有概念特别指定在Anthropic生态系统内研究、开发与实施。作者以两句格言总结:“最好的记忆系统知道该忘记什么”和“存储铅,交付棉”。