AI News HubLIVE
站內改寫2 分鐘閱讀

維基記憶

本文提出“維基記憶”模式,即使用智能體將原始數據壓縮為持久化、結構化、可供智能體讀取的知識層。它與RAG不同,通過預計算並維護高層綜合,避免智能體每次重複發現結構。文章列舉了DeepWiki、Karpathy的LLM Wiki、Factory的AutoWiki等實例,並討論了原始數據格式、壓縮方法及更新維護等開放問題。

哈里森的《圈內》

維基記憶

2026年6月30日

分鐘

返回博客

創建智能體

智能體的記憶仍處於早期階段,幾乎沒有任何標準。“記憶”對每個人來説意義不同。但一種常見模式正在湧現:維基記憶。

這個想法很簡單:使用智能體將原始源數據轉化為一個緊湊、持久、可供智能體讀取的知識層。

為什麼是維基?

原始數據包含大量知識,但直接暴露給智能體通常效率低下。日誌、筆記、代碼、文檔、實驗、Slack線程和轉錄內容過於嘈雜且龐大。因此,我們對其運行一個過程,將其轉化為更密集的表示。

這與基本的RAG不同。RAG通常在查詢時檢索原始塊。而維基預計算並維護更高級的綜合,這樣智能體無需每次都重新發現結構。

這種需求幾乎無處不在。當與一家研究公司的朋友交談時,他談到了研究人員頭腦中的所有知識。他想要“克隆他們的大腦”,這樣即使他們離開,知識仍留在公司。他希望通過查看他們進行的實驗、撰寫的筆記和採取的行動,可以近似實現這種“大腦克隆”。

維基是一種實現這一目標的實用方法:不是存儲一切,而是將重要內容壓縮成一個可重用的知識庫。

什麼是“維基”?

維基是一種由智能體維護的數據結構,以智能體友好的方式表示源知識。

在實踐中,這通常意味着對某些源材料運行一個智能體,並要求它創建一組文件,未來的智能體可以用它們更快地理解領域。

重要的不是它字面上看起來像維基百科。重要的是它是持久的、結構化的、可檢查的,並且隨時間更新。

維基的例子

Cognition的DeepWiki大概是我記得見過的第一個例子。DeepWiki為GitHub倉庫生成AI生成的文檔。它旨在為人類和編碼智能體提供代碼庫的高級心智地圖,使其更易於理解和導航。

Karpathy最近寫了關於他所謂的“LLM維基”或“LLM知識庫”的文章。這是同一模式更通用的形式:不僅適用於代碼,還可以處理任意源文件。他的框架是LLM逐步構建並維護一個持久的markdown維基,位於用户和原始源之間。

Factory推出了AutoWiki作為類似DeepWiki的產品。AutoWiki分析代碼庫並生成結構化、可瀏覽的文檔,且隨着倉庫變化保持最新。

這種模式也與LangMem、Letta、Mem0和Zep等記憶系統相鄰。那些系統解決更廣泛的智能體記憶問題,而維基記憶之所以引人注目,是因為它通常使用最簡單的可能基板:文件。

每個領域的維基

我認為每個領域都存在一個你值得創建的知識庫。這個知識庫不僅僅是原始數據。它是原始數據的智能壓縮版本。

這裏有一堆開放性問題:

什麼是原始數據?

壓縮數據的最佳格式是什麼?

數據應如何壓縮?

壓縮表示應如何保持更新?

我們開始看到一些常見答案浮現:

什麼是原始數據?→ 智能體可以讀取或訪問的任何內容

壓縮數據的最佳格式是什麼?→ 文件

如何壓縮數據?→ 一個智能體

如何維護?→ 一個智能體

文件具有吸引力,因為它們可檢查、可編輯、可版本化,並且便於智能體讀寫。

維基並非全部記憶。它們最適合持久的領域知識,而非短期對話狀態、用户偏好或高頻事件日誌。但對於許多領域,維基記憶可能是我們擁有的最簡單有用的長期記憶模式。

看你的智能體真正在做什麼

LangSmith,我們的智能體工程平台,幫助開發者調試每個智能體決策、評估變更並一鍵部署。

嘗試LangSmith

獲取演示