NVIDIA BioNeMo Agent Toolkit 在 Baseten 上发布
NVIDIA BioNeMo Agent Toolkit 旨在将通用 AI 智能体转变为能够执行真实生物学和药物发现任务的科学智能体。该工具包结合了 BioNeMo Skills、开放模型、NVIDIA NIM 微服务和智能体基础设施,支持蛋白质结构预测、蛋白质设计、虚拟筛选、基因组分析和靶点发现等流程。所有 BioNeMo NIM 微服务现已在 Baseten 模型库中可用,方便开发者部署和扩展科学 AI 应用。
NVIDIA BioNeMo Agent Toolkit 于近日在 Baseten 平台上发布,旨在将通用 AI 智能体转变为能够执行真实生物学和药物发现任务的科学智能体。该工具包结合了 BioNeMo Skills、开放模型、NVIDIA NIM 微服务和智能体基础设施,支持蛋白质结构预测、蛋白质设计、虚拟筛选、基因组分析和靶点发现等流程。
科学 AI 正在从孤立的模型推理向能够推理、规划并执行多步骤科学任务的智能体工作流演进。科学家们越来越需要能够理解科学文献、预测蛋白质结构、设计分子、分析基因组数据、识别治疗靶点并推荐下一步实验的 AI 系统。NVIDIA BioNeMo Agent Toolkit 提供了实现新一代 AI 科学家所需的领域特定工具、模型和技能。它结合了 BioNeMo Skills、开放模型、NVIDIA NIM 微服务和智能体编排基础设施,帮助智能体从“阅读科学”转变为“实践科学”。
Baseten 平台专为需要大规模运行模型推理的团队构建,且这些团队越来越多地来自生命科学领域。向智能体工作流的转变改变了“运行模型”的含义:不再是单个调用,而是智能体编排一个由专门模型组成的流水线,每个模型将结构化输出传递给下一个模型。这恰好是 Baseten 旨在解决的基础设施问题。当 NVIDIA 与 Baseten 分享 BioNeMo 工具包时,它提供了客户所缺少的生物学推理层。BioNeMo NIM 是领域特定的设计——不是为生物学调整的通用模型,而是从零开始为结构预测、分子生成和基因组学训练的模型。将其与 Baseten 的推理基础设施配对,意味着生命科学研究团队可以端到端地运行完整的发现流水线,而无需自行搭建和管理底层的计算资源。
NVIDIA NIM 微服务是一种 Docker 容器,通过小型 HTTP API 提供单个模型的推理服务,其中包含了权重、CUDA 和服务堆栈。BioNeMo 是 NVIDIA 的 AI 驱动生物学和药物发现平台,提供开放模型、库、数据集、工具和用于科学 AI 工作负载的 NIM 微服务。BioNeMo 产品组合涵盖三大类别:
- 理解生物学:分析生物序列并识别生物学意义的模型,例如从原始序列映射分子3D形状。示例包括 Evo 2。
- 设计新疗法:生成蛋白质、抗体和分子的模型,例如设计全新的功能性蛋白质以针对特定疾病。示例包括 RFdiffusion、ProteinMPNN、GenMol、MolMIM。
- 预测结构和相互作用:预测生物分子行为和相互作用的模型,例如读取序列以理解其特性、进化和功能。示例包括 OpenFold2、OpenFold3、Boltz2、DiffDock。
在 Baseten 上可用的 BioNeMo NIM 微服务总结在文章表格中。
除了容器,NVIDIA 还发布了 BioNeMo Skills。Skill 是一个为智能体编写的 Markdown 规范,包含针对给定任务调用哪个端点、认证头、确切的负载字段、如何解析响应以及常见错误的含义。每个模型对应一个 SKILL.md 文件和参考文件,两个“元技能”将多个模型组合成完整的流水线。当智能体指向这些技能时,它可以自主决定折叠序列意味着先收集比对再进行折叠,正确格式化两个负载,然后将数据从一个模型传递到下一个模型。因此,技能将一堆 HTTP 端点转变为智能体可以端到端驱动并提供完整科学工作流的东西。
上下文对于结构模型运行至关重要。AlphaFold 类模型的准确率并非仅来自序列,而是来自进化。找到其他物种中数百个相关蛋白质并将其对齐,数百万年来共同突变的列通常在3D中接触。比对中的共进化信号是折叠器读取的主要内容,这就是为什么单独折叠一个序列会得到明显较差的结果。获取上下文的全部工作由 MSA-Search 完成:GPU MMseqs2 在约1.4TB的参考数据库上进行搜索,将之前需要数十分钟到数小时的 CPU 搜索缩短到几秒钟内完成。
通过 BioNeMo 技能,智能体能够自主执行蛋白质折叠等流程。例如,智能体读取元技能后,进行两次调用:首先进行搜索获取多序列比对,然后将比对文本作为输入传递给折叠模型。当输入为两条链的复合物时,智能体会选择配对搜索而非标准搜索。它可以运行 OpenFold3 两次,一次使用完整比对,一次使用单序列比对,然后读取置信度分数并决定是否信任答案。这种决策能力正是 BioNeMo 技能所赋予的。
除了折叠,BioNeMo Agent Toolkit 还支持更广泛的科学工作流,包括蛋白质结合剂设计、虚拟筛选、基因组分析和靶点发现。这些工作流将孤立的模型调用转变为完整的科学发现流水线。以药物发现为例:GenMol 从支架生成候选分子,DiffDock 将每个候选分子与目标蛋白对齐并仅保留匹配的,Boltz2 预测每个分子的结合强度,最后智能体生成、对接、评分、排序并返回按预测效价排序的候选列表。
所有 BioNeMo NIM 微服务现已在 Baseten 模型库中提供。开发者可以通过 Baseten 的 MCP 直接部署它们,并使用 Baseten Skills 进行调用。同样的模式可以端到端地工作:智能体读取技能,从库中选择正确的 NIM,部署它并开始调用。通过将 BioNeMo Agent Toolkit 在 Baseten 上提供,开发者可以快速部署和扩展科学 AI 工作负载,而无需管理模型服务、GPU 基础设施或编排的复杂性。像 Benchling 这样的团队已经在生产中使用 Baseten 运行 BioNeMo 工作负载,加速从序列到结构再到候选的路径。