NVIDIA BioNeMo Agent Toolkit:将生物分子模型转化为AI智能体的可调用技能,助力药物发现
NVIDIA开源了BioNeMo Agent Toolkit,将OpenFold3、DiffDock、GenMol等生物分子模型封装为AI智能体可调用的技能。每个技能描述模型用途、输入、输出和失败模式,智能体可自主选择、运行和解释结果。在Codex CLI和GPT-5.5 fast基准测试中,技能将任务完成率从57.1%提升至100%,代币效率翻倍。
AI科学家正在成为科学计算的新接口。这些智能体能够阅读论文、编写代码、生成假设、调用API和检查文件。但科学不是软件工程——没有测试套件会在假设正确时变绿。发现过程仍然是迭代的、不确定的,并且根植于物理世界。
NVIDIA正是针对这一差距推出了BioNeMo Agent Toolkit。NVIDIA发布了一篇实操指南,其论点直截了当:一个指向生物学领域的通用编码智能体不会产生新药物。在生物分子研究中,智能体的上限取决于它能可靠、正确且高效使用的工具。
简而言之,BioNeMo Agent Toolkit将NVIDIA的生物分子模型打包为文档化的可调用智能体技能。这些技能涵盖蛋白质折叠、分子对接、生成化学、基因组学分析和蛋白质设计。NVIDIA报告称,使用技能后任务完成率从57.1%提升至100%,智能体每千代币的通过断言数平均翻倍。托管NIM端点适合快速访问,本地NIM则适合重复迭代。
什么是BioNeMo Agent Toolkit?它是一个开源的智能体“技能”仓库。每个技能将一个NVIDIA生物分子模型转化为智能体可调用的工具。该工具包封装了蛋白质折叠、分子对接、生成化学、基因组学分析、蛋白质设计和生物标志物发现等功能。
NVIDIA将平台分为两部分。第一部分是加速工具层:NVIDIA NIM(NVIDIA推理微服务)和BioNeMo开放模型通过cuEquivariance(用于结构模型)和Parabricks(用于基因组学)等库提供核心能力。第二部分是智能体就绪接口:BioNeMo Skills将每个能力打包,以便智能体使用。一个技能文档记录模型的用途、所需输入、可选参数、预期输出和失败模式。模型上下文协议(MCP)服务器包装器暴露了尚未打包为NIM的开放模型。
仓库将技能分为nim-skills、open-models-skills和library-skills。workflows文件夹包含多步骤元技能,例如generative_protein_binder_design,它串联了RFdiffusion→ProteinMPNN→OpenFold3。
技能如何工作?每个技能目录包含一个SKILL.md文件,内有YAML前置元数据以及指令、可选引用和可选脚本。智能体将其作为文档读取,然后执行。所有模型遵循相同的提示模式。以OpenFold3为例,其他NIM(如Boltz-2、DiffDock、GenMol、ProteinMPNN、MSA Search、RFdiffusion和Evo 2)也适用。用户只需指定技能、输入和端点。
安装通过开源技能CLI完成:npx skills add NVIDIA-BioNeMo/bionemo-agent-toolkit 或按需安装单个技能。部署有两种方式:使用托管NIM端点获得快速访问,无需管理基础设施;或部署本地NIM以降低预热延迟、实现数据本地性或重复迭代。
基准测试显示,在Codex CLI和GPT-5.5 fast上,无技能时任务完成率为57.1%,使用NIM技能后达到100%。效率方面,每千代币通过断言数翻倍。
用例包括:蛋白质结构预测(Boltz-2或OpenFold3返回CIF文件)、多序列比对(MSA Search生成A3M文件)、生成化学(GenMol输出SDF或SMILES)、蛋白质结合剂设计(RFdiffusion→ProteinMPNN→OpenFold3工作流)。每个循环遵循相同模式:智能体选择模型、准备输入、运行、检查输出并带着注意事项解释结果。
与无技能智能体对比:任务完成率从57.1%升至100%,代币效率翻倍,模型选择从猜测变为读取文档,部署从手动设置变为托管/本地NIM,失败处理有文档记录,工作流支持多步骤元技能。
入门要求:需要智能体运行时(如Claude或Codex)、NVIDIA API密钥(托管端点),GPU节点可选(本地部署)。建议先让智能体枚举仓库能力,再赋予单个技能。NVIDIA提醒:build.nvidia.com端点仅用于小规模开发测试,并非生产级推理;同时强调验证低置信度结构和过滤生成分子。
更多信息请查看GitHub仓库和技术细节。