構建理解化學原理的AI模型
麻省理工學院副教授Connor Coley將化學與機器學習相結合,加速藥物發現,並開發出融入化學直覺的AI模型。
據估計,在所有可能的化學化合物中,有10^20到10^60種可能具有作為小分子藥物的潛力。逐一進行實驗評估對化學家來説過於耗時。因此,近年來研究人員開始利用人工智能來幫助識別可能成為良好候選藥物的化合物。
麻省理工學院副教授Connor Coley正是這樣一位研究者。他身兼化學工程系、電氣工程與計算機科學系以及施瓦茨曼計算機學院的教職,研究橫跨化學工程與計算機科學,致力於開發和部署計算模型,以分析海量可能的化學化合物、設計新化合物並預測能夠生成這些化合物的反應路徑。
Coley對科學的興趣源於家庭。他的父親是一名放射科醫生,母親擁有分子生物物理和生物化學學位,祖母是數學教授。高中時,他參加了科學奧林匹克競賽,16歲畢業,隨後進入加州理工學院主修化學工程,希望結合科學和數學的興趣。在校期間,他還用Fortran語言協助解析蛋白質晶體結構。畢業後,他於2014年來到MIT攻讀博士,師從Klavs Jensen和William Green教授,研究優化自動化化學反應,將機器學習與化學信息學結合以規劃新藥物分子的反應路徑,同時設計硬件自動執行這些反應。
博士畢業後,Coley在博德研究所進行了為期一年的博士後研究,專注於從DNA編碼庫中識別可能與疾病相關突變蛋白結合的小分子。2020年回到MIT後,他建立了自己的實驗室,致力於利用AI不僅合成具有治療潛力的現有化合物,還設計具有理想性質的新分子及其合成方法。
他的實驗室開發了多個計算模型。ShEPhERD模型根據藥物分子的三維形狀及其與靶蛋白的相互作用來評估候選藥物,已被製藥公司用於新藥發現。FlowER模型則是一種生成式AI,可預測不同化學輸入組合後的反應產物,並在設計中融入了質量守恆等基本物理原理以及中間步驟的可行性約束,從而提高了預測準確性。
Coley表示:“我們試圖賦予生成模型更多的藥物化學直覺,使其瞭解正確的標準和考量。同時,我們花費大量時間確保機器學習模型像專家化學家一樣,基於對反應機理的理解。”他的實驗室還涉及計算機輔助結構解析、實驗室自動化和實驗設計優化等多個與化學反應優化相關的領域。通過這些不同的研究線索,Coley希望推動AI在化學領域的前沿發展。