2026-06-30 22:46 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 22:58 UTC+8

維基記憶

本文提出“維基記憶”模式，即使用智慧體將原始資料壓縮為持久化、結構化、可供智慧體讀取的知識層。它與RAG不同，透過預計算並維護高層綜合，避免智慧體每次重複發現結構。文章列舉了DeepWiki、Karpathy的LLM Wiki、Factory的AutoWiki等例項，並討論了原始資料格式、壓縮方法及更新維護等開放問題。

來源LangChain Blog

哈里森的《圈內》

維基記憶

2026年6月30日

分鐘

返回部落格

建立智慧體

智慧體的記憶仍處於早期階段，幾乎沒有任何標準。“記憶”對每個人來說意義不同。但一種常見模式正在湧現：維基記憶。

這個想法很簡單：使用智慧體將原始源資料轉化為一個緊湊、持久、可供智慧體讀取的知識層。

為什麼是維基？

原始資料包含大量知識，但直接暴露給智慧體通常效率低下。日誌、筆記、程式碼、文件、實驗、Slack執行緒和轉錄內容過於嘈雜且龐大。因此，我們對其執行一個過程，將其轉化為更密集的表示。

這與基本的RAG不同。RAG通常在查詢時檢索原始塊。而維基預計算並維護更高階的綜合，這樣智慧體無需每次都重新發現結構。

這種需求幾乎無處不在。當與一家研究公司的朋友交談時，他談到了研究人員頭腦中的所有知識。他想要“克隆他們的大腦”，這樣即使他們離開，知識仍留在公司。他希望透過檢視他們進行的實驗、撰寫的筆記和採取的行動，可以近似實現這種“大腦克隆”。

維基是一種實現這一目標的實用方法：不是儲存一切，而是將重要內容壓縮成一個可重用的知識庫。

什麼是“維基”？

維基是一種由智慧體維護的資料結構，以智慧體友好的方式表示源知識。

在實踐中，這通常意味著對某些源材料執行一個智慧體，並要求它建立一組檔案，未來的智慧體可以用它們更快地理解領域。

重要的不是它字面上看起來像維基百科。重要的是它是持久的、結構化的、可檢查的，並且隨時間更新。

維基的例子

Cognition的DeepWiki大概是我記得見過的第一個例子。DeepWiki為GitHub倉庫生成AI生成的文件。它旨在為人類和編碼智慧體提供程式碼庫的高階心智地圖，使其更易於理解和導航。

Karpathy最近寫了關於他所謂的“LLM維基”或“LLM知識庫”的文章。這是同一模式更通用的形式：不僅適用於程式碼，還可以處理任意原始檔。他的框架是LLM逐步構建並維護一個持久的markdown維基，位於使用者和原始源之間。

Factory推出了AutoWiki作為類似DeepWiki的產品。AutoWiki分析程式碼庫並生成結構化、可瀏覽的文件，且隨著倉庫變化保持最新。

這種模式也與LangMem、Letta、Mem0和Zep等記憶系統相鄰。那些系統解決更廣泛的智慧體記憶問題，而維基記憶之所以引人注目，是因為它通常使用最簡單的可能基板：檔案。

每個領域的維基

我認為每個領域都存在一個你值得建立的知識庫。這個知識庫不僅僅是原始資料。它是原始資料的智慧壓縮版本。

這裡有一堆開放性問題：

什麼是原始資料？

壓縮資料的最佳格式是什麼？

資料應如何壓縮？

壓縮表示應如何保持更新？

我們開始看到一些常見答案浮現：

什麼是原始資料？→ 智慧體可以讀取或訪問的任何內容

壓縮資料的最佳格式是什麼？→ 檔案

如何壓縮資料？→ 一個智慧體

如何維護？→ 一個智慧體

檔案具有吸引力，因為它們可檢查、可編輯、可版本化，並且便於智慧體讀寫。

維基並非全部記憶。它們最適合持久的領域知識，而非短期對話狀態、使用者偏好或高頻事件日誌。但對於許多領域，維基記憶可能是我們擁有的最簡單有用的長期記憶模式。

看你的智慧體真正在做什麼

LangSmith，我們的智慧體工程平臺，幫助開發者除錯每個智慧體決策、評估變更並一鍵部署。

嘗試LangSmith

獲取演示