AI News HubLIVE
站內改寫2 分鐘閱讀

維基記憶

本文提出“維基記憶”模式,即使用智慧體將原始資料壓縮為持久化、結構化、可供智慧體讀取的知識層。它與RAG不同,透過預計算並維護高層綜合,避免智慧體每次重複發現結構。文章列舉了DeepWiki、Karpathy的LLM Wiki、Factory的AutoWiki等例項,並討論了原始資料格式、壓縮方法及更新維護等開放問題。

哈里森的《圈內》

維基記憶

2026年6月30日

分鐘

返回部落格

建立智慧體

智慧體的記憶仍處於早期階段,幾乎沒有任何標準。“記憶”對每個人來說意義不同。但一種常見模式正在湧現:維基記憶。

這個想法很簡單:使用智慧體將原始源資料轉化為一個緊湊、持久、可供智慧體讀取的知識層。

為什麼是維基?

原始資料包含大量知識,但直接暴露給智慧體通常效率低下。日誌、筆記、程式碼、文件、實驗、Slack執行緒和轉錄內容過於嘈雜且龐大。因此,我們對其執行一個過程,將其轉化為更密集的表示。

這與基本的RAG不同。RAG通常在查詢時檢索原始塊。而維基預計算並維護更高階的綜合,這樣智慧體無需每次都重新發現結構。

這種需求幾乎無處不在。當與一家研究公司的朋友交談時,他談到了研究人員頭腦中的所有知識。他想要“克隆他們的大腦”,這樣即使他們離開,知識仍留在公司。他希望透過檢視他們進行的實驗、撰寫的筆記和採取的行動,可以近似實現這種“大腦克隆”。

維基是一種實現這一目標的實用方法:不是儲存一切,而是將重要內容壓縮成一個可重用的知識庫。

什麼是“維基”?

維基是一種由智慧體維護的資料結構,以智慧體友好的方式表示源知識。

在實踐中,這通常意味著對某些源材料執行一個智慧體,並要求它建立一組檔案,未來的智慧體可以用它們更快地理解領域。

重要的不是它字面上看起來像維基百科。重要的是它是持久的、結構化的、可檢查的,並且隨時間更新。

維基的例子

Cognition的DeepWiki大概是我記得見過的第一個例子。DeepWiki為GitHub倉庫生成AI生成的文件。它旨在為人類和編碼智慧體提供程式碼庫的高階心智地圖,使其更易於理解和導航。

Karpathy最近寫了關於他所謂的“LLM維基”或“LLM知識庫”的文章。這是同一模式更通用的形式:不僅適用於程式碼,還可以處理任意原始檔。他的框架是LLM逐步構建並維護一個持久的markdown維基,位於使用者和原始源之間。

Factory推出了AutoWiki作為類似DeepWiki的產品。AutoWiki分析程式碼庫並生成結構化、可瀏覽的文件,且隨著倉庫變化保持最新。

這種模式也與LangMem、Letta、Mem0和Zep等記憶系統相鄰。那些系統解決更廣泛的智慧體記憶問題,而維基記憶之所以引人注目,是因為它通常使用最簡單的可能基板:檔案。

每個領域的維基

我認為每個領域都存在一個你值得建立的知識庫。這個知識庫不僅僅是原始資料。它是原始資料的智慧壓縮版本。

這裡有一堆開放性問題:

什麼是原始資料?

壓縮資料的最佳格式是什麼?

資料應如何壓縮?

壓縮表示應如何保持更新?

我們開始看到一些常見答案浮現:

什麼是原始資料?→ 智慧體可以讀取或訪問的任何內容

壓縮資料的最佳格式是什麼?→ 檔案

如何壓縮資料?→ 一個智慧體

如何維護?→ 一個智慧體

檔案具有吸引力,因為它們可檢查、可編輯、可版本化,並且便於智慧體讀寫。

維基並非全部記憶。它們最適合持久的領域知識,而非短期對話狀態、使用者偏好或高頻事件日誌。但對於許多領域,維基記憶可能是我們擁有的最簡單有用的長期記憶模式。

看你的智慧體真正在做什麼

LangSmith,我們的智慧體工程平臺,幫助開發者除錯每個智慧體決策、評估變更並一鍵部署。

嘗試LangSmith

獲取演示