NVIDIA BioNeMo Agent Toolkit:將生物分子模型轉化為AI智能體的可調用技能,助力藥物發現
NVIDIA開源了BioNeMo Agent Toolkit,將OpenFold3、DiffDock、GenMol等生物分子模型封裝為AI智能體可調用的技能。每個技能描述模型用途、輸入、輸出和失敗模式,智能體可自主選擇、運行和解釋結果。在Codex CLI和GPT-5.5 fast基準測試中,技能將任務完成率從57.1%提升至100%,代幣效率翻倍。
AI科學家正在成為科學計算的新接口。這些智能體能夠閲讀論文、編寫代碼、生成假設、調用API和檢查文件。但科學不是軟件工程——沒有測試套件會在假設正確時變綠。發現過程仍然是迭代的、不確定的,並且根植於物理世界。
NVIDIA正是針對這一差距推出了BioNeMo Agent Toolkit。NVIDIA發佈了一篇實操指南,其論點直截了當:一個指向生物學領域的通用編碼智能體不會產生新藥物。在生物分子研究中,智能體的上限取決於它能可靠、正確且高效使用的工具。
簡而言之,BioNeMo Agent Toolkit將NVIDIA的生物分子模型打包為文檔化的可調用智能體技能。這些技能涵蓋蛋白質摺疊、分子對接、生成化學、基因組學分析和蛋白質設計。NVIDIA報告稱,使用技能後任務完成率從57.1%提升至100%,智能體每千代幣的通過斷言數平均翻倍。託管NIM端點適合快速訪問,本地NIM則適合重複迭代。
什麼是BioNeMo Agent Toolkit?它是一個開源的智能體“技能”倉庫。每個技能將一個NVIDIA生物分子模型轉化為智能體可調用的工具。該工具包封裝了蛋白質摺疊、分子對接、生成化學、基因組學分析、蛋白質設計和生物標誌物發現等功能。
NVIDIA將平台分為兩部分。第一部分是加速工具層:NVIDIA NIM(NVIDIA推理微服務)和BioNeMo開放模型通過cuEquivariance(用於結構模型)和Parabricks(用於基因組學)等庫提供核心能力。第二部分是智能體就緒接口:BioNeMo Skills將每個能力打包,以便智能體使用。一個技能文檔記錄模型的用途、所需輸入、可選參數、預期輸出和失敗模式。模型上下文協議(MCP)服務器包裝器暴露了尚未打包為NIM的開放模型。
倉庫將技能分為nim-skills、open-models-skills和library-skills。workflows文件夾包含多步驟元技能,例如generative_protein_binder_design,它串聯了RFdiffusion→ProteinMPNN→OpenFold3。
技能如何工作?每個技能目錄包含一個SKILL.md文件,內有YAML前置元數據以及指令、可選引用和可選腳本。智能體將其作為文檔讀取,然後執行。所有模型遵循相同的提示模式。以OpenFold3為例,其他NIM(如Boltz-2、DiffDock、GenMol、ProteinMPNN、MSA Search、RFdiffusion和Evo 2)也適用。用户只需指定技能、輸入和端點。
安裝通過開源技能CLI完成:npx skills add NVIDIA-BioNeMo/bionemo-agent-toolkit 或按需安裝單個技能。部署有兩種方式:使用託管NIM端點獲得快速訪問,無需管理基礎設施;或部署本地NIM以降低預熱延遲、實現數據本地性或重複迭代。
基準測試顯示,在Codex CLI和GPT-5.5 fast上,無技能時任務完成率為57.1%,使用NIM技能後達到100%。效率方面,每千代幣通過斷言數翻倍。
用例包括:蛋白質結構預測(Boltz-2或OpenFold3返回CIF文件)、多序列比對(MSA Search生成A3M文件)、生成化學(GenMol輸出SDF或SMILES)、蛋白質結合劑設計(RFdiffusion→ProteinMPNN→OpenFold3工作流)。每個循環遵循相同模式:智能體選擇模型、準備輸入、運行、檢查輸出並帶着注意事項解釋結果。
與無技能智能體對比:任務完成率從57.1%升至100%,代幣效率翻倍,模型選擇從猜測變為讀取文檔,部署從手動設置變為託管/本地NIM,失敗處理有文檔記錄,工作流支持多步驟元技能。
入門要求:需要智能體運行時(如Claude或Codex)、NVIDIA API密鑰(託管端點),GPU節點可選(本地部署)。建議先讓智能體枚舉倉庫能力,再賦予單個技能。NVIDIA提醒:build.nvidia.com端點僅用於小規模開發測試,並非生產級推理;同時強調驗證低置信度結構和過濾生成分子。
更多信息請查看GitHub倉庫和技術細節。