维基记忆
本文提出“维基记忆”模式,即使用智能体将原始数据压缩为持久化、结构化、可供智能体读取的知识层。它与RAG不同,通过预计算并维护高层综合,避免智能体每次重复发现结构。文章列举了DeepWiki、Karpathy的LLM Wiki、Factory的AutoWiki等实例,并讨论了原始数据格式、压缩方法及更新维护等开放问题。
哈里森的《圈内》
维基记忆
2026年6月30日
分钟
返回博客
创建智能体
智能体的记忆仍处于早期阶段,几乎没有任何标准。“记忆”对每个人来说意义不同。但一种常见模式正在涌现:维基记忆。
这个想法很简单:使用智能体将原始源数据转化为一个紧凑、持久、可供智能体读取的知识层。
为什么是维基?
原始数据包含大量知识,但直接暴露给智能体通常效率低下。日志、笔记、代码、文档、实验、Slack线程和转录内容过于嘈杂且庞大。因此,我们对其运行一个过程,将其转化为更密集的表示。
这与基本的RAG不同。RAG通常在查询时检索原始块。而维基预计算并维护更高级的综合,这样智能体无需每次都重新发现结构。
这种需求几乎无处不在。当与一家研究公司的朋友交谈时,他谈到了研究人员头脑中的所有知识。他想要“克隆他们的大脑”,这样即使他们离开,知识仍留在公司。他希望通过查看他们进行的实验、撰写的笔记和采取的行动,可以近似实现这种“大脑克隆”。
维基是一种实现这一目标的实用方法:不是存储一切,而是将重要内容压缩成一个可重用的知识库。
什么是“维基”?
维基是一种由智能体维护的数据结构,以智能体友好的方式表示源知识。
在实践中,这通常意味着对某些源材料运行一个智能体,并要求它创建一组文件,未来的智能体可以用它们更快地理解领域。
重要的不是它字面上看起来像维基百科。重要的是它是持久的、结构化的、可检查的,并且随时间更新。
维基的例子
Cognition的DeepWiki大概是我记得见过的第一个例子。DeepWiki为GitHub仓库生成AI生成的文档。它旨在为人类和编码智能体提供代码库的高级心智地图,使其更易于理解和导航。
Karpathy最近写了关于他所谓的“LLM维基”或“LLM知识库”的文章。这是同一模式更通用的形式:不仅适用于代码,还可以处理任意源文件。他的框架是LLM逐步构建并维护一个持久的markdown维基,位于用户和原始源之间。
Factory推出了AutoWiki作为类似DeepWiki的产品。AutoWiki分析代码库并生成结构化、可浏览的文档,且随着仓库变化保持最新。
这种模式也与LangMem、Letta、Mem0和Zep等记忆系统相邻。那些系统解决更广泛的智能体记忆问题,而维基记忆之所以引人注目,是因为它通常使用最简单的可能基板:文件。
每个领域的维基
我认为每个领域都存在一个你值得创建的知识库。这个知识库不仅仅是原始数据。它是原始数据的智能压缩版本。
这里有一堆开放性问题:
什么是原始数据?
压缩数据的最佳格式是什么?
数据应如何压缩?
压缩表示应如何保持更新?
我们开始看到一些常见答案浮现:
什么是原始数据?→ 智能体可以读取或访问的任何内容
压缩数据的最佳格式是什么?→ 文件
如何压缩数据?→ 一个智能体
如何维护?→ 一个智能体
文件具有吸引力,因为它们可检查、可编辑、可版本化,并且便于智能体读写。
维基并非全部记忆。它们最适合持久的领域知识,而非短期对话状态、用户偏好或高频事件日志。但对于许多领域,维基记忆可能是我们拥有的最简单有用的长期记忆模式。
看你的智能体真正在做什么
LangSmith,我们的智能体工程平台,帮助开发者调试每个智能体决策、评估变更并一键部署。
尝试LangSmith
获取演示