没有人愿意解决的AI记忆问题
本文探讨了长期运行的AI系统中的上下文漂移问题,指出真正的挑战不是模型能力的限制,而是架构设计导致的记忆退化,即架构幻觉。文章对比了LLM幻觉与架构幻觉,并提出了结构化记忆作为解决方案。
在构建AI信号智能日志应用MetaOpAI的过程中,作者遇到了一个核心问题:为什么AI的记忆会随着使用时间变长而越来越差?这并非因为模型突然变笨,也不是上下文窗口太小。深层原因在于,大多数AI系统将聊天历史、摘要、检索和当前上下文混为一谈,误认为是真正的记忆。这种方式在短对话中尚可,但当系统需要长期理解一个人时,就会崩溃。长时间的压缩与迭代导致AI不再是基于用户原话推理,而是基于对先前解释的再解释——这就是记忆漂移的根源。
本文区分了两种幻觉:LLM幻觉(模型捏造事实)和架构幻觉(系统将自身衍生输出再次输入,导致上下文退化)。架构幻觉是应用架构问题,完全在开发者控制范围内。其危害在于,系统看似连贯,实则逐渐偏离用户真实语境,最终用自身累积的解读取代了用户的现实。
作者指出,单纯扩大上下文窗口或使用RAG(检索增强生成)并不能解决根本问题。RAG适用于事实检索,但会丢失个人语境中的细节(如精确措辞、时间戳、矛盾等)。真正的解决方案是结构化记忆:将用户输入转换为独立的记忆记录,通过提取防护栏明确存储内容,并在生成响应前仅检索当前任务相关的记录。记忆层应区分“上下文”(事实)和“元上下文”(用户对事实的解读),并用置信度评分处理矛盾信息。
这种架构借鉴了计算机体系结构:LLM相当于CPU,上下文窗口相当于缓存。持久化存储和内存控制器才是长期记忆的关键。唯有将可信源置于模型之外,才能避免架构幻觉,实现真正的AI记忆。