為AI智能體構建持久化內存的經驗教訓
mem9的故事始於一次客户請求,從一個快速原型發展成一個完整產品。本文分享了構建智能體內存的關鍵經驗:內存不僅僅是存儲問題,而是涉及攝取、排序、評估和產品判斷的工程挑戰。內存API本身不足以構成產品,用户需要查看、檢查、信任和糾正智能體的記憶。此外,評估應成為內存產品的基礎設施,以使質量可視化和可調試。最後,智能體內存不應侷限於文本,應向多模態發展。
文章情報
要點
- mem9起源於客户提出的實際問題,而非市場理論,通過快速原型驗證了價值。
- 智能體內存的核心挑戰並非持久化,而是在生產約束下精確檢索相關信息。
- 僅有內存API遠遠不夠,用户需要可視化和管理記憶的工具。
- 評估與基準測試是內存產品的基礎設施,用於衡量和提升召回質量。
為甚麼重要
這條新聞值得關注,因為mem9起源於客户提出的實際問題,而非市場理論,通過快速原型驗證了價值。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
mem9的故事始於2026年3月一個客户提出的簡單問題:讓智能體記住事情。我們沒有遵循常規的路線圖或架構審查,而是直接構建了一個粗糙的原型,並在客户面前展示。一旦人們看到智能體能夠記住通常會被遺忘的信息,對話立即從“有趣的能力”轉變為“市場需要的產品”。
在最初幾天,我們迅速搭建了核心系統:一個Go服務器、內存API、TiDB Cloud作為存儲層、搜索、認證、速率限制以及首批插件集成。隨後,支持範圍迅速擴展到OpenClaw、OpenCode和Claude Code等智能體環境,同時改進了 onboarding,建立了多租户基礎,並上線了第一個mem9.ai網站。我們不是按順序從基礎設施到產品再到增長,而是所有軌道同時推進,因為一旦價值顯而易見,猶豫比前進更昂貴。
早期我們意識到,智能體內存不能僅僅被視為一個存儲特性。許多討論仍將內存問題框定為“存儲加檢索”,但這過於膚淺。真正的挑戰不在於信息能否被存儲,而在於正確的信息是否在正確的時間以正確的量返回。召回太少會遺漏關鍵細節,召回太多會污染上下文。隨着內存增長,如果召回變得嘈雜,信任就會消失。因此,關鍵在於精度,而非持久化。
這一洞察推動mem9迅速超越基本的內存存儲,轉向一個更具意見的系統,涉及攝取、提取、協調、排序和檢索。我們選擇了以服務器為中心的架構,以便集成保持輕量,而內存邏輯可以集中演進。這使我們能夠改進核心行為,而不是將複雜性推送到每個插件或運行時中。
下一個教訓是:僅有內存API不足以構成產品。人們不僅希望內存存在,還希望看到、檢查、信任、糾正並最終塑造它。因此,我們構建了使內存可理解的界面:會話視圖、時間線視圖、分析工作流、篩選器、預覽和洞察層。這些幫助用户理解不僅記住了什麼,還理解了為什麼重要。這項工作逐漸演變成“你的記憶”,不僅是UI,更是讓長期記憶變得具體而非抽象的方式。
在後端,這一轉變要求不同的工程方法:分類學、分析質量、去重、響應性和更好的報告工作流。第一階段證明了內存能夠工作,而這一階段使其變得可理解和可信。同時,我們還構建了所有讓產品易於被發現的細節:公共網站、文檔、分析、歸屬、聯繫流程、更好的 onboarding,以及最終的API文檔。這些變化雖然不引人注目,但卻是產品增長的關鍵。
一旦用户開始在實際工作流中依賴內存,直覺便不再足夠。我們需要衡量召回質量是否改善或退化。因此,我們將評估視為產品基礎設施,構建了評估框架,將較早的多輪對話數據集適配到現代智能體場景,並創建了反饋循環以指導工程決策。基準測試從學術評分變為產品真相的工具,幫助我們超越直覺,進入可迭代的改善循環。
在構建mem9的過程中,我們還發現內存不應完全不可見。用户將內存體驗為連續性,而非索引。他們關心繫統是否感覺瞭解他們,是否能隨時間連接線索,這種連續性是否可信而非詭異。因此,我們持續投資於可視化,例如Memory Farm——一個像素藝術風格的視覺記憶探索器,記憶如同植物在花園中生長,按主題聚類並通過關係連接。這種設計背後的嚴肅思考是:當用户能以更直觀的形式看到模式、聚類、歷史和關係時,內存變得更易理解。
從外部看,智能體內存是一個熱門類別,但從內部看,它充滿了艱難的邊緣案例:大上下文窗口仍然有限,重要事實被近期噪音掩蓋,樸素檢索帶回錯誤信息,重複浪費token,質量隨內存增長而退化。一旦召回開始顯得隨機,用户信心迅速喪失。mem9從第一天起就構建在這些問題之中,因此產品如此迅速地從原始持久化轉向攝取、協調、混合檢索、排序、分析、基準測試和編排。
隨着構建,我們越來越確信智能體的長期內存應超越純文本檢索。在多模態用例中,內存的含義發生變化:一個有用的內存系統不僅應檢索多年前的句子,還應能檢索圖像、音頻片段、交互和周圍上下文。這一方向塑造了我們的很多思考,尤其是與drive9(我們新的文件和工件產品)的結合。
mem9從一個快速原型發展成為擁有超過一萬用户的產品,僅用了兩週多時間。這段旅程更像一個壓縮的創業年,而非常規軟件項目。我們學到的最重要的東西是:智能體內存不僅關乎存儲,更關乎幫助智能體決定什麼應該保留、什麼應該浮現、什麼應該保持安靜。這是一個工程、產品與人類信任的交匯點。