构建AI神经科学:从原子到比特
本文探讨了利用AI科学家智能体加速神经科学研究的愿景。作者指出,通过创建大脑图谱、数字孪生体以及结合真实实验验证,可以大幅提升研究效率。文章还提出了资助者应优先支持的项目类型,包括高质量数据集、新型神经技术、数字孪生模型和基准测试。
神经科学,通常由大学的小型实验室推动,进展缓慢;博士后和研究生们常常需要十年时间才能完成一个项目。这些研究可能为治疗神经退行性疾病或理解人类智能提供种子。我们如何加速神经科学?
如果我们能使用AI科学家智能体——能够阅读文献、生成假设、读取数据、编写分析代码并设计实验的系统——来研究大脑和行为,无论是直接研究还是通过汇编成图谱和数字孪生体,就有可能极大地加速神经科学。在《Machines of Loving Grace》一书中,Dario Amodei描述了高级AI如何像数据中心里的一群天才一样,在构建智能科学和治愈所有神经精神疾病方面取得快速进展。尽管这些目标崇高,但该文章并未说明如何实现。在此,我描绘了如何构建AI神经科学以及资助者应优先考虑的事项。
AI科学家智能体是AI科学家的一种特殊实例,目前已经初具雏形。2026年5月的《自然》杂志介绍了三种这样的系统,展示了它们在编写实证软件和测试生物医学假设方面的应用。这些系统本质上是具有代理功能的大语言模型,管理上下文、记忆和技能访问。它们的架构类似于编码代理,如Claude Code或OpenAI Codex,但最终产品不是软件或网站,而是从分析中得出的见解。
目前,AI科学家的自主性有限,但我们预计随着大语言模型能力的增长,它们将变得更加能干,类似于我们在编码代理中看到的那样。然而,一个根本性的瓶颈仍然存在:构建高度专业化的神经科学技能。我们预计,这将需要超出单个实验室范围的数据和软件工程,以匹配基础模型的吞吐量。
虽然AI科学家在科学学科中相对通用,但它们研究的对象不同。传统和AI神经科学家的研究对象都是大脑和行为。与代码和数学等可验证领域不同,AI代理可以快速廉价地测试假设,而对大脑和行为进行实验的成本很高。为了取得进展,我们必须尽可能多地将大脑和行为的研究从原子世界转移到比特世界:收集图谱、构建数字孪生体,并通过假设驱动的实验在真实受试者上闭环。
静态数据集要用于AI神经科学家,必须达到图谱的水平:高覆盖率、高信息量的脑图,能够回答比原始实验设计者预期多得多的疑问。自然场景数据集、艾伦脑细胞图谱和FlyWire分别是fMRI、转录组学连接组学领域的近期例子。这些数据集以完整性为目标收集,包含各自领域的代表性样本(或在FlyWire的情况下,完整领域)。它们按照FAIR原则分发:高度注释,在开放平台上分发,提供示例代码和程序化访问。
静态数据集本身不允许我们运行假设实验。为此,我们必须将数据编译成数字孪生体,使我们能够预测不同输入和条件将如何影响系统。在神经科学中,数字孪生体通常是直接训练以模仿神经数据的神经网络,或由数据锚定的生物物理模拟。这里的关键指标是预测有效性:孪生体对感兴趣值的预测与真实生物体中间现象的相关性,最好是在分布外测量。
尽管廉价的实验代理使我们能够筛选无数干预措施,但它们的好坏取决于预测有效性。在药物发现中,Scannell等人(2022)认为,提高0.1的预测有效性(Spearman ρ,0到1之间的值)胜过扫描几个数量级的化合物。我们应该追求具有高预测有效性的模型,这可以通过拟合大量高熵数据(包括因果操纵)来实现。
用不知疲倦的AI神经科学家取代传统神经科学家不会加快传统实验的速度。实际上,瓶颈将从数据分析转移到数据收集。为了看到真实受试者实验的加速,我们预见两条路径:AI神经科学家提出更好、更具区分性的实验来运行;或者AI神经科学家通过实验室自动化更快地运行实验。在未来几年内,运行假设驱动的真实受试者实验仍将是瓶颈。我们应该将这些宝贵资源集中在验证AI神经科学家基于图谱和数字孪生做出的预测上,从而在良性循环中创建更好的模型。
考虑到未来几年AI神经科学如何进展的模式,资助者应关注价值链中的高杠杆点:数据达到图谱水平、更好的神经技术用于构建图谱、更好的数字孪生体、更好的基准测试。规划后AGI未来意味着要考虑广泛的结果,因为锯齿形前沿的不同部分将以不可预测的顺序出现。最重要的是,最好的项目都有一个明确的愿景:他们的研究为何能解锁其他人的约束。