AI在生物学领域面临“模糊API”问题
药物发现缺乏软件工程中清晰的反馈循环和接口,使得机器学习在生物学中的应用面临独特挑战,而不仅仅是生物学本身的复杂性。
AI在生物学领域的应用再度升温,但真正让机器学习在此领域难以施展的,并非仅仅是生物学的复杂性——尽管这确是一个因素。更深层的原因在于,药物发现缺乏软件工程中那种清晰的反馈循环和明确的接口,而正是这些要素让现代ML在其他领域取得了巨大成功。
在软件行业,开发者习惯于使用干净的API:一个团队构建后端服务并暴露端点,另一个团队在此基础上开发。接口是类型化的,对象要么满足契约,要么不满足。出现问题时,通常可以追溯至某个bug,修复代码,重新测试,然后再次部署。这种模式甚至催生了众多市值数十亿美元的公司,例如Supabase(数据库)、Exa(搜索)和NVIDIA(GPU计算)。
人们很容易将药物发现也想象成类似的过程:靶点发现、药物设计、临床试验。但现实远非如此。生物学中的每一步都充满不确定性:一个分子在体外有效,可能在体内无效;一个动物模型成功,可能在人体中失败。反馈循环模糊且缓慢,使得AI模型很难像在软件领域那样快速迭代。理解这种“模糊API”问题是推进AI在生物学中应用的关键。