AI讓化學家只需描述就能設計分子
瑞士洛桑聯邦理工學院(EPFL)的研究人員開發出Synthegy系統,化學家可使用自然語言指導合成與反應規劃。該系統結合大型語言模型與傳統演算法,對最佳路徑進行評分並解釋理由。雙盲研究中,36位化學家對系統結果的同意率達71.2%。
在化學領域,設計新分子是一項極具挑戰的任務,無論是開發救命藥物還是創造尖端材料,每個化合物都需要透過精心設計的一系列反應來構建。傳統的逆向合成分析要求化學家從目標分子出發,逆向推匯出簡單的起始原料和可能的反應路徑,這需要深厚的專業知識和戰略思維。然而,瑞士洛桑聯邦理工學院(EPFL)的Philippe Schwaller團隊開發了一種名為Synthegy的新型AI系統,徹底改變了這一過程。
Synthegy的核心創新在於將大型語言模型(LLM)作為化學推理工具。與以往直接生成化學結構的AI不同,Synthegy的LLM充當評估者,引導現有計算系統。該系統結合了傳統搜尋演算法和能夠理解自然語言化學策略的AI。化學家只需用日常語言描述目標,例如“儘早形成特定環”或“避免不必要的保護基”,標準逆向合成軟體就會生成大量可能路徑。隨後,每條路徑被轉換為文本,由語言模型進行審查和評分,並解釋其推理過程。這使得化學家能夠快速聚焦於符合其策略的最佳路線。
除了逆向合成,Synthegy還應用於反應機理分析。它將反應分解為基本的電子運動,探索不同可能性,並利用語言模型評估每一步,引導搜尋走向化學上合理的路徑。系統還可以整合反應條件或專家假設等額外資訊,允許研究人員細化分析並探索更現實的場景。
在效能驗證中,Synthegy在合成規劃方面表現突出。一項雙盲研究涉及36位化學家,他們提供了368項有效評估,其評判與系統結果的平均一致率達到71.2%。系統能夠標記不必要的保護步驟,判斷反應的可行性,並優先選擇高效方案。研究還發現,較大的語言模型表現最佳,而較小的模型能力有限。
這項研究展示了AI在化學中的全新角色。Synthegy並非取代人類決策,而是將語言模型定位為引導者,幫助解釋和完善計算結果。化學家可以用自然語言描述目標,並獲得反映其策略的解決方案。該方法有望加速藥物發現、改進反應設計,並使先進工具更易被科學家獲取。
研究人員強調,合成規劃與機理之間的連線令人興奮,因為人們通常利用機理髮現新反應,從而合成新分子。Synthegy透過統一的自然語言介面,在計算上彌合了這一差距。未來,這一系統可能成為化學家日常工作中不可或缺的助手。