AI News HubLIVE
站内改写2 分钟阅读

🔬 最酷的扩散研究不在LLM中——Evan Feinberg & Sergey Edunov, Genesis Molecular AI

本文采访了Genesis Molecular AI的联合创始人Evan Feinberg和CTO Sergey Edunov,讨论AI在药物发现领域的突破。他们介绍了PEARL模型在蛋白质-配体共折叠上的创新,以及基于扩散模型的生成式AI如何使自主药物发现循环成为可能。文章还批判了当前基准测试的不足,并展示了PEARL在OpenBind基准上的零样本领先表现。

来源Latent Space作者: Brandon Anderson

在这个时长近两小时的访谈中,我们与Genesis Molecular AI的联合创始人Evan Feinberg和CTO Sergey Edunov深入探讨了人工智能如何彻底改变小分子药物发现。Sergey此前在Meta领导了Llama 2和Llama 3的训练工作,他加入Genesis后惊叹于团队在架构上的新颖创新——这与当前LLM领域缺乏根本性突破形成鲜明对比。

扩散模型在3D结构预测中的前沿应用

Feinberg指出,最创新的扩散研究正发生在3D结构预测领域。Genesis的最新模型PEARL(Place Every Atom at the Right Location)能够理解蛋白质的柔性,不仅预测配体位置,还能对蛋白质进行微小调整以实现更好的契合。这种所谓的“诱导契合”效应长期以来难以建模,而PEARL通过扩散模型成功攻克了这一难题。

自主药物发现的曙光

小分子药物发现面临巨大的搜索空间——约有10^60种可能的类药分子。此外,多参数优化问题极为复杂:强结合能力往往与良好的ADMET性质(吸收、分布、代谢、排泄、毒性)相矛盾。例如,一个好的结合剂通常疏水性较强,但疏水分子可能不溶,无法进入血液。

Genesis在生成式AI上的进展使得自主药物发现循环成为可能。他们内部的SAPPHIRE系统现在可以像化学家一样迭代:观察和分析结合姿势、提出假设、阅读文献、使用内部工具生成候选分子。结合与Incyte等自动化实验室的合作,全天候运行的药物发现智能体正快速成为现实。

基准测试的危机

一个令人惊讶且较少被讨论的问题是,学术界普遍将2Å RMSD作为“好姿势”的基准阈值。Feinberg毫不客气地指出这完全是“slop”——例如,一个芳香环旋转后表面看似合理,但实际上可能误导药物化学家。他主张1Å RMSD才是确保分子核心位置正确的真正阈值,因为氢键的有效范围仅0.6Å。

PEARL在OpenBind上的零样本胜利

在近期发布的OpenBind基准测试中,PEARL在802个从未见过的共复合物上取得了领先成绩。该基准针对EV-A71蛋白质,其诱导契合机制对传统对接方法极具挑战。PEARL无需微调或使用同源数据,便成功建模了配体诱导的蛋白质运动,在所有评估指标上大幅领先其他公开模型。

未来展望

文章作者总结,蛋白质-配体结合问题可能在不久的将来被视为“已解决”。然而,这一进展依赖于机器学习、大规模计算和真实药物发现应用的紧密结合,而目前学术界结构难以支持此类跨学科发展。我们希望这些成果能激励更多研究者。