2026-06-30 22:46 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 22:58 UTC+8

維基記憶

本文提出“維基記憶”模式，即使用智能體將原始數據壓縮為持久化、結構化、可供智能體讀取的知識層。它與RAG不同，通過預計算並維護高層綜合，避免智能體每次重複發現結構。文章列舉了DeepWiki、Karpathy的LLM Wiki、Factory的AutoWiki等實例，並討論了原始數據格式、壓縮方法及更新維護等開放問題。

來源LangChain Blog

哈里森的《圈內》

維基記憶

2026年6月30日

分鐘

返回博客

創建智能體

智能體的記憶仍處於早期階段，幾乎沒有任何標準。“記憶”對每個人來説意義不同。但一種常見模式正在湧現：維基記憶。

這個想法很簡單：使用智能體將原始源數據轉化為一個緊湊、持久、可供智能體讀取的知識層。

為什麼是維基？

原始數據包含大量知識，但直接暴露給智能體通常效率低下。日誌、筆記、代碼、文檔、實驗、Slack線程和轉錄內容過於嘈雜且龐大。因此，我們對其運行一個過程，將其轉化為更密集的表示。

這與基本的RAG不同。RAG通常在查詢時檢索原始塊。而維基預計算並維護更高級的綜合，這樣智能體無需每次都重新發現結構。

這種需求幾乎無處不在。當與一家研究公司的朋友交談時，他談到了研究人員頭腦中的所有知識。他想要“克隆他們的大腦”，這樣即使他們離開，知識仍留在公司。他希望通過查看他們進行的實驗、撰寫的筆記和採取的行動，可以近似實現這種“大腦克隆”。

維基是一種實現這一目標的實用方法：不是存儲一切，而是將重要內容壓縮成一個可重用的知識庫。

什麼是“維基”？

維基是一種由智能體維護的數據結構，以智能體友好的方式表示源知識。

在實踐中，這通常意味着對某些源材料運行一個智能體，並要求它創建一組文件，未來的智能體可以用它們更快地理解領域。

重要的不是它字面上看起來像維基百科。重要的是它是持久的、結構化的、可檢查的，並且隨時間更新。

維基的例子

Cognition的DeepWiki大概是我記得見過的第一個例子。DeepWiki為GitHub倉庫生成AI生成的文檔。它旨在為人類和編碼智能體提供代碼庫的高級心智地圖，使其更易於理解和導航。

Karpathy最近寫了關於他所謂的“LLM維基”或“LLM知識庫”的文章。這是同一模式更通用的形式：不僅適用於代碼，還可以處理任意源文件。他的框架是LLM逐步構建並維護一個持久的markdown維基，位於用户和原始源之間。

Factory推出了AutoWiki作為類似DeepWiki的產品。AutoWiki分析代碼庫並生成結構化、可瀏覽的文檔，且隨着倉庫變化保持最新。

這種模式也與LangMem、Letta、Mem0和Zep等記憶系統相鄰。那些系統解決更廣泛的智能體記憶問題，而維基記憶之所以引人注目，是因為它通常使用最簡單的可能基板：文件。

每個領域的維基

我認為每個領域都存在一個你值得創建的知識庫。這個知識庫不僅僅是原始數據。它是原始數據的智能壓縮版本。

這裏有一堆開放性問題：

什麼是原始數據？

壓縮數據的最佳格式是什麼？

數據應如何壓縮？

壓縮表示應如何保持更新？

我們開始看到一些常見答案浮現：

什麼是原始數據？→ 智能體可以讀取或訪問的任何內容

壓縮數據的最佳格式是什麼？→ 文件

如何壓縮數據？→ 一個智能體

如何維護？→ 一個智能體

文件具有吸引力，因為它們可檢查、可編輯、可版本化，並且便於智能體讀寫。

維基並非全部記憶。它們最適合持久的領域知識，而非短期對話狀態、用户偏好或高頻事件日誌。但對於許多領域，維基記憶可能是我們擁有的最簡單有用的長期記憶模式。

看你的智能體真正在做什麼

LangSmith，我們的智能體工程平台，幫助開發者調試每個智能體決策、評估變更並一鍵部署。

嘗試LangSmith

獲取演示