AI News HubLIVE
站内改写2 分钟阅读

维基记忆

本文提出“维基记忆”模式,即使用智能体将原始数据压缩为持久化、结构化、可供智能体读取的知识层。它与RAG不同,通过预计算并维护高层综合,避免智能体每次重复发现结构。文章列举了DeepWiki、Karpathy的LLM Wiki、Factory的AutoWiki等实例,并讨论了原始数据格式、压缩方法及更新维护等开放问题。

哈里森的《圈内》

维基记忆

2026年6月30日

分钟

返回博客

创建智能体

智能体的记忆仍处于早期阶段,几乎没有任何标准。“记忆”对每个人来说意义不同。但一种常见模式正在涌现:维基记忆。

这个想法很简单:使用智能体将原始源数据转化为一个紧凑、持久、可供智能体读取的知识层。

为什么是维基?

原始数据包含大量知识,但直接暴露给智能体通常效率低下。日志、笔记、代码、文档、实验、Slack线程和转录内容过于嘈杂且庞大。因此,我们对其运行一个过程,将其转化为更密集的表示。

这与基本的RAG不同。RAG通常在查询时检索原始块。而维基预计算并维护更高级的综合,这样智能体无需每次都重新发现结构。

这种需求几乎无处不在。当与一家研究公司的朋友交谈时,他谈到了研究人员头脑中的所有知识。他想要“克隆他们的大脑”,这样即使他们离开,知识仍留在公司。他希望通过查看他们进行的实验、撰写的笔记和采取的行动,可以近似实现这种“大脑克隆”。

维基是一种实现这一目标的实用方法:不是存储一切,而是将重要内容压缩成一个可重用的知识库。

什么是“维基”?

维基是一种由智能体维护的数据结构,以智能体友好的方式表示源知识。

在实践中,这通常意味着对某些源材料运行一个智能体,并要求它创建一组文件,未来的智能体可以用它们更快地理解领域。

重要的不是它字面上看起来像维基百科。重要的是它是持久的、结构化的、可检查的,并且随时间更新。

维基的例子

Cognition的DeepWiki大概是我记得见过的第一个例子。DeepWiki为GitHub仓库生成AI生成的文档。它旨在为人类和编码智能体提供代码库的高级心智地图,使其更易于理解和导航。

Karpathy最近写了关于他所谓的“LLM维基”或“LLM知识库”的文章。这是同一模式更通用的形式:不仅适用于代码,还可以处理任意源文件。他的框架是LLM逐步构建并维护一个持久的markdown维基,位于用户和原始源之间。

Factory推出了AutoWiki作为类似DeepWiki的产品。AutoWiki分析代码库并生成结构化、可浏览的文档,且随着仓库变化保持最新。

这种模式也与LangMem、Letta、Mem0和Zep等记忆系统相邻。那些系统解决更广泛的智能体记忆问题,而维基记忆之所以引人注目,是因为它通常使用最简单的可能基板:文件。

每个领域的维基

我认为每个领域都存在一个你值得创建的知识库。这个知识库不仅仅是原始数据。它是原始数据的智能压缩版本。

这里有一堆开放性问题:

什么是原始数据?

压缩数据的最佳格式是什么?

数据应如何压缩?

压缩表示应如何保持更新?

我们开始看到一些常见答案浮现:

什么是原始数据?→ 智能体可以读取或访问的任何内容

压缩数据的最佳格式是什么?→ 文件

如何压缩数据?→ 一个智能体

如何维护?→ 一个智能体

文件具有吸引力,因为它们可检查、可编辑、可版本化,并且便于智能体读写。

维基并非全部记忆。它们最适合持久的领域知识,而非短期对话状态、用户偏好或高频事件日志。但对于许多领域,维基记忆可能是我们拥有的最简单有用的长期记忆模式。

看你的智能体真正在做什么

LangSmith,我们的智能体工程平台,帮助开发者调试每个智能体决策、评估变更并一键部署。

尝试LangSmith

获取演示