2026-05-07 04:31 UTC+8站内改写6 分钟阅读更新: 2026-06-27 08:25 UTC+8

我并不认为我们接近“AI科学家”

当前AI代理并非为从新观察中提取深层洞察而设计，缺乏持续学习和隐性知识转移能力，因此距离真正的“AI科学家”还很遥远。

来源Understanding AI作者: Timothy B. Lee

今年二月，我的同事Kai Williams指出，LLM有一种不可思议的能力，能根据未发表的文章识别作者。最近几周，Megan McArdle和Kelsey Piper等记者证实了这一点。

我决定亲自尝试。2012年，一位朋友付我500美元写一篇关于“加拿大枫糖浆大劫案”的文章，但从未发表。上周五，我以隐身模式打开ChatGPT，粘贴了文章中的五段内容。

ChatGPT表示不确定作者是谁，猜测可能是Nate Silver或我以前的Vox.com同事Matthew Yglesias。当我添加了四段后，聊天机器人回应：“这个我很有把握——是Timothy B. Lee写的。”

但当我问ChatGPT为何认为文章是我写的时，它无法给出具体原因。“尽管Timothy B. Lee经常写清晰、说明性的文章，但这里没有像指纹一样的东西——没有重复的短语、特定的政策框架或已知的文章结构可以明确地与他联系起来。”

我认为这里有一个超越作者识别的教训。

人们拥有大量隐性知识——我们知道但难以完全解释的东西。人们常用身体相关的隐喻来描述这种现象：我们说一个想法“在舌尖上”，我们“无法准确指出”，或者我们“凭直觉”知道某事。

LLM也有类似情况：它们执行认知任务的能力远远超过它们明确解释如何以及为何能执行这些任务的能力。

但人与LLM之间有一个重要区别。人脑不断学习；在一天中，我们的大脑不断建立新联系、识别新模式、形成新预感。我们的隐性知识库不断扩大。

相比之下，LLM仅在训练期间这样做。LLM有不可思议的作者识别能力——但仅限于训练数据中充分代表的作者。一旦模型训练完成，其权重被冻结，学习新模式（例如新作者的写作风格）的能力大大降低。

最近，人们对Claude Code和OpenClaw等AI代理的兴奋之情高涨。很多炒作是合理的。Claude Code确实正在彻底改变计算机编程，而像OpenClaw这样的代理很可能改变经济其他部分和我们的日常生活。

行业领导者预计近期会有更大变化。在上个月的采访中，Sam Altman表示OpenAI目标是在2028年3月前构建一个“自动化AI研究员”。一些人期望这（或竞争对手的类似突破）将引发递归自我改进循环，从而极大加速科学和技术进步。

这最终可能发生，但我认为还需要一段时间。

人类科学家进行实验时，他们的大脑在数据中寻找可能产生新见解和新世界模型的模式。但AI科学家——至少基于今天LLM和代理架构的——无法以同样丰富的方式从实验中学习。它们没有可靠或可扩展的方式从推理时看到的数据中构建隐性知识。

解决这个问题可能需要从根本上重新思考当今前沿模型核心的Transformer架构。至少，需要彻底改革当前的代理框架。

代理如何处理有限的LLM上下文

许多困难的知识任务需要长时间“思考”。然而LLM只能在其工作记忆（即上下文窗口）中存储有限数量的令牌。对于领先模型，这个限制在过去几年一直停留在约100万个令牌。此外，由于经济约束和上下文腐烂问题（我在11月写过），AI开发者尽量保持在最大值以下。

管理这种紧张关系一直是AI行业的主要焦点，开发了一套“上下文工程”技术来高效使用上下文。例如，现代聊天机器人经历一个压缩过程，旧信息定期被删除或总结。

这造成一种模型拥有比实际更长上下文的错觉。但如果压缩出错，可能会有很大副作用。在一个可怕的事件中，一名女性要求她的AI代理建议删除的电子邮件，但不要实际删除。不幸的是，后一个请求在压缩过程中丢失，因此代理开始大量删除她的电子邮件。

去年，AI公司尝试允许模型在上下文窗口之外存储持久信息。Claude Code是这方面的一步。Claude Code在用户自己的计算机上运行，可以读取和修改本地硬盘上的文件。一旦Claude Code完成特定编程任务，它可以将结果写入受影响的文件，不再需要将细节保留在上下文中。

2025年底发布的OpenClaw更进一步。它是一个在用户本地计算机上运行AI代理的通用框架。OpenClaw代理——如同Claude Code代理——可以读写本地文件系统的文件，允许它们存储相关文档并跟踪未完成的任务。

对OpenClaw和其他本地代理的热情导致对苹果Mac mini电脑的需求激增。在Mac Mini上安装OpenClaw允许代理连接到iMessage等苹果服务。同时，由于macOS基于Unix，代理可以访问称为Unix shell的强大命令行界面。

“归根结底，你的代理只是它的文件”

在最近一期Latent Space播客中，风险投资家Marc Andreessen认为像OpenClaw这样的代理代表了一种重要的新计算范式。以下是一个略有编辑的摘录：

“我们现在知道一个代理是这样的：它是一个语言模型。它是一个Unix shell。代理可以访问shell。然后是一个文件系统。状态存储在文件中。文件采用Markdown格式。然后基本上Unix中所谓的cron job——一个循环和一个心跳——然后东西就醒来了……

所以这就是架构。然后事实证明，你的代理是什么？你的代理是存储在文件系统中的一堆文件。

这意味着你的代理独立于它运行所用的模型，因为你可以在代理下面换一个不同的LLM。你的代理会在某种程度上改变个性，因为模型不同，但存储在文件中的所有状态都会保留。它仍然是你的代理，拥有所有记忆和所有能力。

你也可以换掉shell。所以你可以把它移动到不同的执行环境。你还可以换掉文件系统。你可以换掉心跳、cron框架、代理框架本身。归根结底，你的代理只是它的文件。

因此，代理可以自我迁移。你可以指示你的代理：‘迁移到不同的运行时环境，迁移到不同的文件系统，换掉语言模型。’你的代理会为你做所有这些事情。

代理拥有完全的内省能力。它知道自己的文件，可以重写自己的文件。这引出了一个当我理解它时完全震撼了我的能力：你可以告诉代理为自己添加新功能和特性。

所以你在派对上遇到某人，他们说：‘哦，我有我的OpenClaw做任何事情——连接到我的Eight Sleep床，给我更好的睡眠建议。’然后你晚上回家——或者就在派对上——告诉你的OpenClaw：‘给自己添加这个能力。’

然后你的Claw会说：‘好的，没问题。’它会去互联网上找出需要的东西，然后编写需要的东西，然后接下来你知道，它就有了这个新能力。你可以让它升级自己，除了告诉它你想这么做之外，什么都不用做。”

这个范式只有几个月的历史，所以我预计在未来几年内会有显著发展。例如，未来大多数AI代理是在用户本地计算机上运行，还是更多人使用在云端虚拟机上的OpenClaw类代理，这还不明确。但我认为Andreessen说这是一种重要的新计算范式是对的。

同时，Andreessen的言论凸显了为什么我仍然怀疑今天的AI模型会达到人类水平智能的一个大原因。让我眼睛一亮的是这句话：“你的代理只是它的文件。”我认为值得分析这对它们未来能力意味着什么。

办公室里的“记忆碎片”

2000年的电影《记忆碎片》讲述了一个主角患短期记忆丧失的故事。为了应对这一点，他经常写笔记为未来的自己提供指导和指示。OpenClaw做类似的事情——语言模型本身定期重置其上下文窗口，但代理通过给自己写笔记来维持连贯性。

以下是一个类比。假设你需要一名员工，但不是永久雇佣，而是从临时机构每周派不同的人来。

每周结束时，这名工人花几小时详细记录本周的工作。

每名临时工周一早上进来时，都受过其行业和职业的一般培训。所以当他们开始阅读时，只需要了解这份工作特有的信息，而不是该领域广泛知道的背景信息（毕竟LLM从各个领域的一般知识开始）。他们可能没有时间阅读前辈写的所有内容，但笔记组织良好，他们可以使用搜索工具快速找到最相关的文档。

这种安排效果如何？取决于工作性质。有些工作——接待员、药剂师、水管工——相当事务性。工人不需要在预约之间保持太多上下文，所以每周由不同的人提供服务无所谓。

但有些工作上下文非常重要。有些人与同一客户合作多年，深入了解他们的情况和目标。其他工作需要工人进行数周或数月的深入调研，以开发新见解。

在类似这样的工作中，新工人可能很容易需要超过一周的阅读才能“跟上进度”。

2010年我在谷歌实习。我的第一个任务是在一个内部数据库中添加一列。这只需要几行代码。但我花了数周时间阅读，以了解足够的谷歌系统和开发流程来编写这些代码。

这并不限于编程。在许多知识密集型行业，新员工需要几个月（至少）才能了解工作到开始增值的程度。在此之前，员工需要如此多的“手把手指导”，以至于经理自己完成工作会更快。在这样的行业，工人每周轮换是行不通的。

隐性知识与显性知识

我知道批评者会说什么：人类工人需要数小时阅读一份10万字的文档。LLM可以在几秒钟内完成。如果基于LLM的编码代理在2010年存在，它们不会花数周对谷歌数据库进行小修改。

LLM的速度意味着OpenClaw风格的代理一次迭代可以为后继者留下非常详细的笔记。它也意味着OpenClaw可以在人类工人做一次的时间内进行数百次读取-行动-写入循环。

这可能意味着OpenClaw代理能够比我的人类类比所暗示的完成更多工作。经过数千次迭代，它们可能即使在相当困难的问题上也能取得进展。

这个观点有一定道理，但我认为许多人类工作仍然遥不可及。

四年前，我写了一篇关于“贪婪工作”概念的文章——那些工作时间越长，每小时收入越高的工人。工作可能变得贪婪有很多原因，但一个主要因素是知识工作者往往经验越多，工作质量越高。更多经验（更多上下文）的优势可以在几十年的职业生涯中持续叠加。

例如，我写了20多年关于技术和经济的文章。我写过英国脱欧、专利流氓、激光雷达传感器和许多其他话题。在任何一个时间点，这些知识大部分与我正在写的内容无关。但总体而言，它增加了我在任何给定话题上说出有趣东西的几率。

让我写下我所知道的一切，将笔记交给另一位记者，并期望她像我一样做好我的工作，这是完全不切实际的。不仅因为需要我花几个月总结20年职业学到的东西，还因为我有很多隐性知识，我不知道如何用语言表达。

我的显性信念——那些我能在谈话中表达或在电子邮件中写下的东西——只是冰山一角。水面下是更大的一组预感、模糊关联和半成形的理论。由于这些东西是隐性的，它们不能轻易转移给另一个人。但它们对我做好工作至关重要。

我发表的顿悟常常始于预感。在我弄清楚如何证明某事之前，我早已确信它是真的。通常我需要“在脑海中翻转一个想法”数小时或数天，才能清晰地解释它。

我不认为我独一无二。同样的情况似乎也适用于科学家、工程师、企业领袖和许多其他知识型职业。许多见解最初是作为人们头脑中的隐性想法——或“在舌尖上”——然后才有人想通如何将其翻译成英语、Python或任何其他显性形式。

正如我之前讨论的，LLM确实有类似这样的隐性知识。但大部分（如果不是全部）是在初始训练过程中学习的。LLM似乎缺乏持续学习的能力：即在推理时遇到的信息中识别新模式并形成新预感的能力。

此外，无论LLM在特定会话中发展出什么隐性知识，当代理框架将控制权从一个LLM实例转移到下一个时，这些知识都会丢失。在这种转移过程中，代理所知道的一切都存储在一组外部文件中——正如Andreessen所说，“你的代理只是它的文件。”根据定义，隐性知识——代理无法用自然语言、代码或其他显性形式解释的知识——不会在这些交接中存活下来。

我强烈预感，这些未成熟的想法是人们用来形成对世界独创见解的原材料。因此，我怀疑至少在未来几年内，我们需要人类工人来为我们进行深度思考。

感谢Daniel Kagan-Kans、Andrew Lee、Steve Newman和Nat Purser对本文初稿的反馈。

披露：我哥哥是一家提供云AI代理初创公司的CEO（我也是股东）。