2026-06-30 22:46 UTC+8站内改写2 分钟阅读更新: 2026-06-30 22:58 UTC+8

维基记忆

本文提出“维基记忆”模式，即使用智能体将原始数据压缩为持久化、结构化、可供智能体读取的知识层。它与RAG不同，通过预计算并维护高层综合，避免智能体每次重复发现结构。文章列举了DeepWiki、Karpathy的LLM Wiki、Factory的AutoWiki等实例，并讨论了原始数据格式、压缩方法及更新维护等开放问题。

来源LangChain Blog

哈里森的《圈内》

维基记忆

2026年6月30日

分钟

返回博客

创建智能体

智能体的记忆仍处于早期阶段，几乎没有任何标准。“记忆”对每个人来说意义不同。但一种常见模式正在涌现：维基记忆。

这个想法很简单：使用智能体将原始源数据转化为一个紧凑、持久、可供智能体读取的知识层。

为什么是维基？

原始数据包含大量知识，但直接暴露给智能体通常效率低下。日志、笔记、代码、文档、实验、Slack线程和转录内容过于嘈杂且庞大。因此，我们对其运行一个过程，将其转化为更密集的表示。

这与基本的RAG不同。RAG通常在查询时检索原始块。而维基预计算并维护更高级的综合，这样智能体无需每次都重新发现结构。

这种需求几乎无处不在。当与一家研究公司的朋友交谈时，他谈到了研究人员头脑中的所有知识。他想要“克隆他们的大脑”，这样即使他们离开，知识仍留在公司。他希望通过查看他们进行的实验、撰写的笔记和采取的行动，可以近似实现这种“大脑克隆”。

维基是一种实现这一目标的实用方法：不是存储一切，而是将重要内容压缩成一个可重用的知识库。

什么是“维基”？

维基是一种由智能体维护的数据结构，以智能体友好的方式表示源知识。

在实践中，这通常意味着对某些源材料运行一个智能体，并要求它创建一组文件，未来的智能体可以用它们更快地理解领域。

重要的不是它字面上看起来像维基百科。重要的是它是持久的、结构化的、可检查的，并且随时间更新。

维基的例子

Cognition的DeepWiki大概是我记得见过的第一个例子。DeepWiki为GitHub仓库生成AI生成的文档。它旨在为人类和编码智能体提供代码库的高级心智地图，使其更易于理解和导航。

Karpathy最近写了关于他所谓的“LLM维基”或“LLM知识库”的文章。这是同一模式更通用的形式：不仅适用于代码，还可以处理任意源文件。他的框架是LLM逐步构建并维护一个持久的markdown维基，位于用户和原始源之间。

Factory推出了AutoWiki作为类似DeepWiki的产品。AutoWiki分析代码库并生成结构化、可浏览的文档，且随着仓库变化保持最新。

这种模式也与LangMem、Letta、Mem0和Zep等记忆系统相邻。那些系统解决更广泛的智能体记忆问题，而维基记忆之所以引人注目，是因为它通常使用最简单的可能基板：文件。

每个领域的维基

我认为每个领域都存在一个你值得创建的知识库。这个知识库不仅仅是原始数据。它是原始数据的智能压缩版本。

这里有一堆开放性问题：

什么是原始数据？

压缩数据的最佳格式是什么？

数据应如何压缩？

压缩表示应如何保持更新？

我们开始看到一些常见答案浮现：

什么是原始数据？→ 智能体可以读取或访问的任何内容

压缩数据的最佳格式是什么？→ 文件

如何压缩数据？→ 一个智能体

如何维护？→ 一个智能体

文件具有吸引力，因为它们可检查、可编辑、可版本化，并且便于智能体读写。

维基并非全部记忆。它们最适合持久的领域知识，而非短期对话状态、用户偏好或高频事件日志。但对于许多领域，维基记忆可能是我们拥有的最简单有用的长期记忆模式。

看你的智能体真正在做什么

LangSmith，我们的智能体工程平台，帮助开发者调试每个智能体决策、评估变更并一键部署。

尝试LangSmith

获取演示