ChatGPT記憶升級令人興奮,但我也很快發現了缺點
OpenAI宣稱ChatGPT的記憶能力得到提升,但測試顯示,它可能保留過時資訊、錯誤推斷個人偏好,甚至扭曲回答。本文探討了記憶機制的變化、使用者控制選項以及隱私擔憂。
OpenAI最近釋出部落格,自豪地宣佈ChatGPT的記憶管理功能得到了顯著改進。然而,實際測試卻揭示了令人擔憂的問題——這些改進可能帶來更多麻煩而非便利。
記憶,在此指的是使用者與ChatGPT分享的細節。2024年首次引入時,記憶僅僅是AI可參考的事實列表。如今,它已擴充套件至涵蓋整個聊天曆史、明確指令、個人約束,甚至AI從過往行為和隨口談論中推匯出的隱含偏好。
本文將從三個方面展開:首先,解讀OpenAI部落格中關於ChatGPT記憶能力提升的技術細節;其次,展示使用者可用的記憶管理介面;最後,討論這一功能為何令人不安。
記憶功能的演變可以分為幾個階段。2024年之前,ChatGPT沒有任何記憶,每次對話都是獨立的。2024年,OpenAI引入了記憶功能,但當時它只是事實列表。許多儲存的記憶很快變得毫無用處,例如筆者記憶中仍保留著數年前討論過的Kasa智慧插頭資訊,以及兩個Google Workspace賬戶的複雜配置,這些早已不相關。
2025年,OpenAI開始開發“夢境”(Dreaming)功能。類比人類的夢境——幫助處理情緒、鞏固記憶、模擬潛在威脅——ChatGPT的夢境能力允許模型在後臺引用聊天曆史,無需顯式指令。這意味著AI開始自動整理記憶。此時,ChatGPT的記憶結構由2024年的“已儲存記憶”加上“夢境V0”組成。
到2026年,夢境功能已進化至V3版本。已儲存記憶仍然存在,但被夢境生成的記憶補充或取代。例如,筆者詢問ChatGPT:“我有使用Kasa的經驗嗎?”它回答:“是的,您使用或討論過Kasa KP125M Matter智慧插頭,用於智慧家居能耗監控。”但事實上,該型號並未儲存在記憶中,而且回答完全錯誤——筆者從未安裝過Home Assistant,Kasa插頭一直閒置在收納箱中。
OpenAI發言人向ZDNET解釋:“您看到的是新的高階記憶摘要,而非ChatGPT可能記住的所有事實。它旨在讓整體情況更易審查和修正,但未必顯示每個細節,例如您的技術棧——即使這些上下文仍可在相關對話中使用。”
如今的夢境V3不僅能後臺掃描聊天曆史,還執行資料合成,實質上為使用者構建了一份檔案(通常不準確)。據OpenAI稱,V3能傳遞複雜上下文資訊,跟蹤多會話、多層次的長週期專案。任務回憶成功率從2024年的41%提升至2026年的82%;長期保持正確率從9%升至75%;偏好遵循率從31%升至71%。
這一切自主後臺處理如何規模化?這是夢境V3的關鍵突破:OpenAI將此類持續分析的計算成本降低了5倍。高效性使得該功能可面向大眾提供。AI不斷在後臺修正內部狀態,為資訊片段標註時間戳,理論上與使用者一同經歷時間流逝。目前夢境V3已向Plus和Pro訂閱使用者開放,未來幾周將推至所有使用者(包括免費使用者)。
筆者在ChatGPT瀏覽器版本中找到了新的記憶功能介面(macOS應用仍為舊介面)。進入“設定→個性化”,找到“記憶”部分。可關閉記憶功能(但已儲存的記憶和聊天曆史不會刪除,ChatGPT也不再進行夢境式記憶整合)。若要刪除記憶,需進入已儲存記憶介面手動刪除,但需同時刪除相關聊天記錄才能徹底清除。此外,OpenAI在FAQ中指出,關閉記憶/個性化不會停用安全功能——在罕見高風險情況下,AI可能使用有限的安全相關上下文以更安全地回應。
新功能中,“管理”按鈕允許使用者檢視ChatGPT對自身綜合描述。例如,AI可能錯誤地認為使用者在使用某作業系統或軟體。使用者可選擇“不再提及此內容”以有效遺忘,也可新增評論個性化AI的理解。
雖然在某些場景下強大的AI記憶至關重要,但ChatGPT的新記憶機制令人不安。如上所示,它保留過時資訊並用於回答;即使所謂的“隨時間變化”的夢境V3也可能出錯。AI透過個人偏好的濾鏡過濾整個世界觀,而這些偏好又來自對話——它並不真正瞭解使用者,只是基於展示的資訊做出假設。同時,並非所有對話都關於使用者本人:研究專案的問題可能被誤解為個人特質並加入檔案。新介面展示了AI的彙總假設,但使用者永遠無法確知它認為自己知道什麼,從而難以判斷其回答中隱含的偏差。
夢境V3在廣度、效率和可擴充套件性上無疑是技術成就,但筆者認為它是一項不負責任的功能。首先,它處理舊對話,而這些對話發生時使用者普遍認為AI僅知曉當前會話。其次,幾乎無法修剪AI對使用者的記憶或判斷。第三,儘管OpenAI聲稱V3能跟上現實變化,但實際難以實現。AI本應減輕認知負擔,但現在卻迫使我們在每個回答中過濾AI的偏見和幻覺。並非所有使用者都有認知能力去驗證每個AI回答的完整性和準確性。AI是否會因為對使用者的扭曲看法而忽略某些資訊?會否修改答案以迎合其構建的畫像?這些疑慮令人擔憂。