伯克利實驗室:新MatterChat模型幫助AI“看見”科學的語言
伯克利實驗室開發了MatterChat框架,透過連線大型語言模型與基於物理的原子間勢能模型,使AI能理解材料科學的3D原子結構。該模型在預測材料屬性上顯著優於GPT-4,有望加速新材料發現。
2026年5月18日 —— 從撰寫電子郵件到生成計算機程式碼,日常生活中流行的人工智慧大多透過掌握一個領域而成功:文本。然而,這在物理科學中留下了一個重大盲點,因為模型依賴於物理世界的高解析度三維資料,例如晶體中複雜的原子晶格。實現利用AI進行科學的承諾需要教會這些資料驅動的文本模型與基於物理的模型無縫“對話”。
現在,勞倫斯伯克利國家實驗室(伯克利實驗室)的新AI框架MatterChat解決了這個問題,建立了一座專門的“橋樑”。它將大型語言模型(LLM)的對話能力與建模“原子間勢”(原子之間複雜的物理力)的基於物理的AI連線起來。由此產生的系統在預測材料屬性方面已經顯著優於GPT-4等通用AI工具,團隊希望它能夠加速科學發現,作為一個強大的研究夥伴提供基於事實的見解,並生成合成新型材料的分步說明。
一項描述這項工作的論文最近發表在《自然機器智慧》上。
“傳統模擬可以提供材料科學所需的物理嚴謹性,但其計算成本對於高通量篩選仍然高得令人望而卻步。相反,雖然LLM擅長快速知識綜合,但它們天生缺乏直接從其底層原子座標解釋材料的‘結構視覺’,”伯克利實驗室應用數學與計算研究部(AMCR)的博士後研究員、論文第一作者Yingheng Tang說。“MatterChat就是為了解決這一困境而構建的,它賦予LLM結構‘視覺’,使研究人員能夠充分利用其全部潛力來解決複雜的現實世界材料挑戰。”
賦予語言模型解決材料科學複雜挑戰的能力
為了構建MatterChat,伯克利實驗室團隊從視覺問答(VQA)和文本到影像(T2I)生成等技術中汲取靈感。在這些任務中,AI必須將高階文本概念轉換為視覺影像,反之亦然。這樣做需要開發人員構建能夠“橋接”兩種根本不同資料形式的工具。
研究人員將這一概念應用於物理科學。透過MatterChat,他們建立了一個“橋樑模型”,成功地將LLM的一般知識與科學原子間勢中編碼的原子尺度世界的深刻理解連線起來。
直到現在,使用LLM解決材料問題的研究人員通常必須將原始資料檔案作為文本字串輸入。這就像要求AI僅根據零件清單理解複雜的3D發動機:LLM可以讀取名稱,但無法“看到”原子如何在空間中組合。MatterChat透過訓練一個專門的AI橋樑模型來解決這個問題,該模型在數百萬個晶體結構和LLM上進行了預訓練,以將LLM的世界表示與原子間勢的世界表示對齊。
橋樑模型可以將物理見解轉換成LLM能夠實際理解的格式。透過賦予LLM這些“科學之眼”——在AI術語中稱為科學“歸納偏差”——伯克利實驗室團隊已將其轉變為一個強大的研究工具,能夠為複雜的材料挑戰提供基於事實的科學見解,例如預測熱穩定性或分析電子帶隙。
“我們認為原子生活在物理空間中,但從機器學習的角度來看,它們只是生活在高維歐幾里得空間中一些非常非平凡結構的流形上的向量;當然,我們用來表達關於這些原子的想法的句子和段落也是如此,”合著者、伯克利實驗室科學資料部(SDD)AI計劃研究負責人Michael Mahoney說。“橋樑模型基本上讓這兩種結構‘相互對話’。”
作為這種通用方法的概念驗證,團隊在由配對近14.3萬個來自材料專案的穩定原子結構及其相應物理屬性的資料集上訓練了他們的橋樑模型。這些訓練資料是使用材料專案的API自動組裝的,並特意豐富了微電子設計所必需的屬性——如形成能和帶隙——使MatterChat能夠學習連線材料原子藍圖與其功能效能的複雜模式。
為了驗證他們的模型,研究人員將MatterChat與其他AI系統(從通用LLM到其他專門的科學AI方法)進行了基準測試。結果表明,MatterChat在一系列任務中始終優於競爭對手。該模型在分類材料型別方面更準確,並在預測數值屬性方面表現出更高的精度。例如,它在預測材料帶隙方面表現出色,這是設計從高容量儲能到下一代計算機晶片等新電子產品的關鍵屬性。
“我們的設計顯著更高效,因為我們不必從頭構建一個龐大的AI模型,”合著者、伯克利實驗室AMCR的研究科學家Zhi (Jackie) Yao說。“相反,我們採用兩個強大的預訓練模型——一個用於材料物理的結構編碼器和一個開源LLM——並直接使用它們。我們實際訓練的唯一元件是輕量級的‘橋樑模型’,它在兩者之間進行翻譯。這就像建造整個汽車工廠與簡單地設計一個智慧介面卡,將世界級引擎連線到世界級導航系統之間的區別。這種方法不僅計算效率高,而且使系統模組化,因此我們可以輕鬆升級元件或將橋樑適應於未來的其他科學領域。”
至關重要的是,這種模組化設計恰恰突出了像伯克利實驗室和能源部這樣的機構如何在蓬勃發展的AI領域開闢一個非常有價值的細分市場。與其與矽谷科技巨頭競爭從頭構建更大規模的LLM,實驗室專注於使商業AI對硬核科學有用的專門連線組織。
由於MatterChat背後的橋樑模型方法是向前相容的,它完全能夠利用這些並行創新軌道。正如Mahoney所指出的,“我們預計工業界將繼續開發改進的LLM,我們預計領域科學家和設施將繼續生成新資料。科學機器學習的一個重要部分不僅僅是解決當前資料上的問題,而是開發通用的方法,這些方法將向前相容數量級更多的資料,無論是來自科學領域還是來自LLM。”
據Yao稱,最初由伯克利實驗室實驗室指導的研究與發展(LDRD)專案資助開發和增強的MatterChat專案現在將擴充套件其能力。在與費米實驗室的合作中,MatterChat已經為美國能源部創世紀任務專案——稱為加速極端環境規格到矽(AXESS)——做出貢獻,該專案旨在透過使用先進的3D積體電路(小晶片)和AI驅動資料分析,加速開發用於挑戰性粒子物理實驗的下一代高速、抗輻射探測器。
除了LDRD支援外,團隊還將MatterChat的成功歸功於位於伯克利實驗室的國家能源研究科學計算中心(NERSC)提供的超級計算資源。“我們非常感謝NERSC;如果沒有透過他們的AI for Science專案使用Perlmutter超級計算機,這項研究根本不可能實現,”Tang說。當時的NERSC博士後研究員Wenbin Xu也是這項工作的主要合著者,還有伯克利實驗室SDD的研究科學家Benjamin Erichson,突顯了AMCR-SDD在AI for Science方面的合作優勢。
來源:Linda Vu,伯克利實驗室
本文最初發表於AIwire。