AI News HubLIVE
站内改写3 分钟阅读

ChatGPT记忆升级令人兴奋,但我也很快发现了缺点

OpenAI宣称ChatGPT的记忆能力得到提升,但测试显示,它可能保留过时信息、错误推断个人偏好,甚至扭曲回答。本文探讨了记忆机制的变化、用户控制选项以及隐私担忧。

来源ZDNet AI

OpenAI最近发布博客,自豪地宣布ChatGPT的记忆管理功能得到了显著改进。然而,实际测试却揭示了令人担忧的问题——这些改进可能带来更多麻烦而非便利。

记忆,在此指的是用户与ChatGPT分享的细节。2024年首次引入时,记忆仅仅是AI可参考的事实列表。如今,它已扩展至涵盖整个聊天历史、明确指令、个人约束,甚至AI从过往行为和随口谈论中推导出的隐含偏好。

本文将从三个方面展开:首先,解读OpenAI博客中关于ChatGPT记忆能力提升的技术细节;其次,展示用户可用的记忆管理界面;最后,讨论这一功能为何令人不安。

记忆功能的演变可以分为几个阶段。2024年之前,ChatGPT没有任何记忆,每次对话都是独立的。2024年,OpenAI引入了记忆功能,但当时它只是事实列表。许多保存的记忆很快变得毫无用处,例如笔者记忆中仍保留着数年前讨论过的Kasa智能插头信息,以及两个Google Workspace账户的复杂配置,这些早已不相关。

2025年,OpenAI开始开发“梦境”(Dreaming)功能。类比人类的梦境——帮助处理情绪、巩固记忆、模拟潜在威胁——ChatGPT的梦境能力允许模型在后台引用聊天历史,无需显式指令。这意味着AI开始自动整理记忆。此时,ChatGPT的记忆结构由2024年的“已保存记忆”加上“梦境V0”组成。

到2026年,梦境功能已进化至V3版本。已保存记忆仍然存在,但被梦境生成的记忆补充或取代。例如,笔者询问ChatGPT:“我有使用Kasa的经验吗?”它回答:“是的,您使用或讨论过Kasa KP125M Matter智能插头,用于智能家居能耗监控。”但事实上,该型号并未保存在记忆中,而且回答完全错误——笔者从未安装过Home Assistant,Kasa插头一直闲置在收纳箱中。

OpenAI发言人向ZDNET解释:“您看到的是新的高级记忆摘要,而非ChatGPT可能记住的所有事实。它旨在让整体情况更易审查和修正,但未必显示每个细节,例如您的技术栈——即使这些上下文仍可在相关对话中使用。”

如今的梦境V3不仅能后台扫描聊天历史,还执行数据合成,实质上为用户构建了一份档案(通常不准确)。据OpenAI称,V3能传递复杂上下文信息,跟踪多会话、多层次的长周期项目。任务回忆成功率从2024年的41%提升至2026年的82%;长期保持正确率从9%升至75%;偏好遵循率从31%升至71%。

这一切自主后台处理如何规模化?这是梦境V3的关键突破:OpenAI将此类持续分析的计算成本降低了5倍。高效性使得该功能可面向大众提供。AI不断在后台修正内部状态,为信息片段标注时间戳,理论上与用户一同经历时间流逝。目前梦境V3已向Plus和Pro订阅用户开放,未来几周将推至所有用户(包括免费用户)。

笔者在ChatGPT浏览器版本中找到了新的记忆功能界面(macOS应用仍为旧界面)。进入“设置→个性化”,找到“记忆”部分。可关闭记忆功能(但已存储的记忆和聊天历史不会删除,ChatGPT也不再进行梦境式记忆整合)。若要删除记忆,需进入已保存记忆界面手动删除,但需同时删除相关聊天记录才能彻底清除。此外,OpenAI在FAQ中指出,关闭记忆/个性化不会禁用安全功能——在罕见高风险情况下,AI可能使用有限的安全相关上下文以更安全地回应。

新功能中,“管理”按钮允许用户查看ChatGPT对自身综合描述。例如,AI可能错误地认为用户在使用某操作系统或软件。用户可选择“不再提及此内容”以有效遗忘,也可添加评论个性化AI的理解。

虽然在某些场景下强大的AI记忆至关重要,但ChatGPT的新记忆机制令人不安。如上所示,它保留过时信息并用于回答;即使所谓的“随时间变化”的梦境V3也可能出错。AI通过个人偏好的滤镜过滤整个世界观,而这些偏好又来自对话——它并不真正了解用户,只是基于展示的信息做出假设。同时,并非所有对话都关于用户本人:研究项目的问题可能被误解为个人特质并加入档案。新界面展示了AI的汇总假设,但用户永远无法确知它认为自己知道什么,从而难以判断其回答中隐含的偏差。

梦境V3在广度、效率和可扩展性上无疑是技术成就,但笔者认为它是一项不负责任的功能。首先,它处理旧对话,而这些对话发生时用户普遍认为AI仅知晓当前会话。其次,几乎无法修剪AI对用户的记忆或判断。第三,尽管OpenAI声称V3能跟上现实变化,但实际难以实现。AI本应减轻认知负担,但现在却迫使我们在每个回答中过滤AI的偏见和幻觉。并非所有用户都有认知能力去验证每个AI回答的完整性和准确性。AI是否会因为对用户的扭曲看法而忽略某些信息?会否修改答案以迎合其构建的画像?这些疑虑令人担忧。