AIが化学者の分子設計を自然言語で支援
EPFLの研究チームが開発したSynthegyは、化学者が自然言語で合成や反応計画を指示できるAIシステム。大規模言語モデルと従来アルゴリズムを組み合わせ、最適な経路をスコア化して説明する。二重盲検試験では、36名の化学者がシステムの結果に平均71.2%同意した。
化学における新しい分子の設計は、生命を救う医薬品から最先端材料まで、各化合物を注意深く計画された一連の反応で構築する必要がある困難な課題です。従来の逆合成分析では、化学者は目的分子から出発し、より単純な出発物質と可能な反応経路を逆算する必要があり、深い専門知識と戦略的思考が求められていました。しかし、EPFLのPhilippe Schwaller率いる研究チームは、このプロセスを一変させる新しいAIシステム「Synthegy」を開発しました。
Synthegyの核心は、大規模言語モデル(LLM)を化学推論ツールとして活用することです。従来のAIが直接化学構造を生成するのに対し、SynthegyのLLMは評価者として機能し、既存の計算システムを導きます。このシステムは従来の検索アルゴリズムと、自然言語で書かれた化学戦略を理解できるAIを組み合わせています。化学者が日常言語で目標を記述すると(例:「特定の環を早期に形成する」「不要な保護基を避ける」)、標準的な逆合成ソフトウェアが多数の可能な経路を生成します。その後、各経路がテキストに変換され、言語モデルによって評価され、スコア付けされ、その推論が説明されます。これにより、化学者は自分の戦略に合った最良の経路に迅速に焦点を当てられます。
Synthegyは逆合成だけでなく、反応機構の解析にも応用されます。反応を基本的な電子の動きに分解し、さまざまな可能性を探索し、言語モデルが各ステップを評価して化学的に理にかなった経路へと探索を導きます。システムは反応条件や専門家の仮説などの追加情報もテキストとして取り込むことができ、研究者は分析を洗練させ、より現実的なシナリオを探索できます。
性能検証では、Synthegyは合成計画において優れた結果を示しました。二重盲検試験では36名の化学者が368件の有効な評価を提供し、その判断はシステムの結果と平均71.2%一致しました。システムは不要な保護段階を指摘し、反応の実現可能性を判断し、効率的な解決策を優先することができます。また、大規模なLLMほど性能が高く、小規模モデルでは能力が限られることも明らかになりました。
この研究は、化学におけるAIの新たな役割を示しています。Synthegyは人間の意思決定を置き換えるのではなく、言語モデルをガイドとして位置づけ、計算結果の解釈と改良を支援します。化学者は平易な言葉で目標を記述し、自分の戦略を反映した解決策を得ることができます。このアプローチは創薬を加速し、反応設計を改善し、高度なツールをより多くの科学者が利用できるようにする可能性を秘めています。
研究者らは、合成計画とメカニズムの接続は非常にエキサイティングであり、通常、メカニズムを利用して新反応を発見し、新分子を合成すると述べています。Synthegyは統一された自然言語インターフェースを通じて、計算的にそのギャップを埋めています。将来、このシステムは化学者の日常業務に欠かせないツールとなるでしょう。