伯克利实验室:新MatterChat模型帮助AI“看见”科学的语言
伯克利实验室开发了MatterChat框架,通过连接大型语言模型与基于物理的原子间势能模型,使AI能理解材料科学的3D原子结构。该模型在预测材料属性上显著优于GPT-4,有望加速新材料发现。
2026年5月18日 —— 从撰写电子邮件到生成计算机代码,日常生活中流行的人工智能大多通过掌握一个领域而成功:文本。然而,这在物理科学中留下了一个重大盲点,因为模型依赖于物理世界的高分辨率三维数据,例如晶体中复杂的原子晶格。实现利用AI进行科学的承诺需要教会这些数据驱动的文本模型与基于物理的模型无缝“对话”。
现在,劳伦斯伯克利国家实验室(伯克利实验室)的新AI框架MatterChat解决了这个问题,创建了一座专门的“桥梁”。它将大型语言模型(LLM)的对话能力与建模“原子间势”(原子之间复杂的物理力)的基于物理的AI连接起来。由此产生的系统在预测材料属性方面已经显著优于GPT-4等通用AI工具,团队希望它能够加速科学发现,作为一个强大的研究伙伴提供基于事实的见解,并生成合成新型材料的分步说明。
一项描述这项工作的论文最近发表在《自然机器智能》上。
“传统模拟可以提供材料科学所需的物理严谨性,但其计算成本对于高通量筛选仍然高得令人望而却步。相反,虽然LLM擅长快速知识综合,但它们天生缺乏直接从其底层原子坐标解释材料的‘结构视觉’,”伯克利实验室应用数学与计算研究部(AMCR)的博士后研究员、论文第一作者Yingheng Tang说。“MatterChat就是为了解决这一困境而构建的,它赋予LLM结构‘视觉’,使研究人员能够充分利用其全部潜力来解决复杂的现实世界材料挑战。”
赋予语言模型解决材料科学复杂挑战的能力
为了构建MatterChat,伯克利实验室团队从视觉问答(VQA)和文本到图像(T2I)生成等技术中汲取灵感。在这些任务中,AI必须将高级文本概念转换为视觉图像,反之亦然。这样做需要开发人员构建能够“桥接”两种根本不同数据形式的工具。
研究人员将这一概念应用于物理科学。通过MatterChat,他们创建了一个“桥梁模型”,成功地将LLM的一般知识与科学原子间势中编码的原子尺度世界的深刻理解连接起来。
直到现在,使用LLM解决材料问题的研究人员通常必须将原始数据文件作为文本字符串输入。这就像要求AI仅根据零件清单理解复杂的3D发动机:LLM可以读取名称,但无法“看到”原子如何在空间中组合。MatterChat通过训练一个专门的AI桥梁模型来解决这个问题,该模型在数百万个晶体结构和LLM上进行了预训练,以将LLM的世界表示与原子间势的世界表示对齐。
桥梁模型可以将物理见解转换成LLM能够实际理解的格式。通过赋予LLM这些“科学之眼”——在AI术语中称为科学“归纳偏差”——伯克利实验室团队已将其转变为一个强大的研究工具,能够为复杂的材料挑战提供基于事实的科学见解,例如预测热稳定性或分析电子带隙。
“我们认为原子生活在物理空间中,但从机器学习的角度来看,它们只是生活在高维欧几里得空间中一些非常非平凡结构的流形上的向量;当然,我们用来表达关于这些原子的想法的句子和段落也是如此,”合著者、伯克利实验室科学数据部(SDD)AI计划研究负责人Michael Mahoney说。“桥梁模型基本上让这两种结构‘相互对话’。”
作为这种通用方法的概念验证,团队在由配对近14.3万个来自材料项目的稳定原子结构及其相应物理属性的数据集上训练了他们的桥梁模型。这些训练数据是使用材料项目的API自动组装的,并特意丰富了微电子设计所必需的属性——如形成能和带隙——使MatterChat能够学习连接材料原子蓝图与其功能性能的复杂模式。
为了验证他们的模型,研究人员将MatterChat与其他AI系统(从通用LLM到其他专门的科学AI方法)进行了基准测试。结果表明,MatterChat在一系列任务中始终优于竞争对手。该模型在分类材料类型方面更准确,并在预测数值属性方面表现出更高的精度。例如,它在预测材料带隙方面表现出色,这是设计从高容量储能到下一代计算机芯片等新电子产品的关键属性。
“我们的设计显著更高效,因为我们不必从头构建一个庞大的AI模型,”合著者、伯克利实验室AMCR的研究科学家Zhi (Jackie) Yao说。“相反,我们采用两个强大的预训练模型——一个用于材料物理的结构编码器和一个开源LLM——并直接使用它们。我们实际训练的唯一组件是轻量级的‘桥梁模型’,它在两者之间进行翻译。这就像建造整个汽车工厂与简单地设计一个智能适配器,将世界级引擎连接到世界级导航系统之间的区别。这种方法不仅计算效率高,而且使系统模块化,因此我们可以轻松升级组件或将桥梁适应于未来的其他科学领域。”
至关重要的是,这种模块化设计恰恰突出了像伯克利实验室和能源部这样的机构如何在蓬勃发展的AI领域开辟一个非常有价值的细分市场。与其与硅谷科技巨头竞争从头构建更大规模的LLM,实验室专注于使商业AI对硬核科学有用的专门连接组织。
由于MatterChat背后的桥梁模型方法是向前兼容的,它完全能够利用这些并行创新轨道。正如Mahoney所指出的,“我们预计工业界将继续开发改进的LLM,我们预计领域科学家和设施将继续生成新数据。科学机器学习的一个重要部分不仅仅是解决当前数据上的问题,而是开发通用的方法,这些方法将向前兼容数量级更多的数据,无论是来自科学领域还是来自LLM。”
据Yao称,最初由伯克利实验室实验室指导的研究与发展(LDRD)项目资助开发和增强的MatterChat项目现在将扩展其能力。在与费米实验室的合作中,MatterChat已经为美国能源部创世纪任务项目——称为加速极端环境规格到硅(AXESS)——做出贡献,该项目旨在通过使用先进的3D集成电路(小芯片)和AI驱动数据分析,加速开发用于挑战性粒子物理实验的下一代高速、抗辐射探测器。
除了LDRD支持外,团队还将MatterChat的成功归功于位于伯克利实验室的国家能源研究科学计算中心(NERSC)提供的超级计算资源。“我们非常感谢NERSC;如果没有通过他们的AI for Science项目使用Perlmutter超级计算机,这项研究根本不可能实现,”Tang说。当时的NERSC博士后研究员Wenbin Xu也是这项工作的主要合著者,还有伯克利实验室SDD的研究科学家Benjamin Erichson,突显了AMCR-SDD在AI for Science方面的合作优势。
来源:Linda Vu,伯克利实验室
本文最初发表于AIwire。