AI News HubLIVE
站內改寫3 分鐘閱讀

NVIDIA BioNeMo Agent Toolkit 在 Baseten 上發佈

NVIDIA BioNeMo Agent Toolkit 旨在將通用 AI 智能體轉變為能夠執行真實生物學和藥物發現任務的科學智能體。該工具包結合了 BioNeMo Skills、開放模型、NVIDIA NIM 微服務和智能體基礎設施,支持蛋白質結構預測、蛋白質設計、虛擬篩選、基因組分析和靶點發現等流程。所有 BioNeMo NIM 微服務現已在 Baseten 模型庫中可用,方便開發者部署和擴展科學 AI 應用。

NVIDIA BioNeMo Agent Toolkit 於近日在 Baseten 平台上發佈,旨在將通用 AI 智能體轉變為能夠執行真實生物學和藥物發現任務的科學智能體。該工具包結合了 BioNeMo Skills、開放模型、NVIDIA NIM 微服務和智能體基礎設施,支持蛋白質結構預測、蛋白質設計、虛擬篩選、基因組分析和靶點發現等流程。

科學 AI 正在從孤立的模型推理向能夠推理、規劃並執行多步驟科學任務的智能體工作流演進。科學家們越來越需要能夠理解科學文獻、預測蛋白質結構、設計分子、分析基因組數據、識別治療靶點並推薦下一步實驗的 AI 系統。NVIDIA BioNeMo Agent Toolkit 提供了實現新一代 AI 科學家所需的領域特定工具、模型和技能。它結合了 BioNeMo Skills、開放模型、NVIDIA NIM 微服務和智能體編排基礎設施,幫助智能體從“閲讀科學”轉變為“實踐科學”。

Baseten 平台專為需要大規模運行模型推理的團隊構建,且這些團隊越來越多地來自生命科學領域。向智能體工作流的轉變改變了“運行模型”的含義:不再是單個調用,而是智能體編排一個由專門模型組成的流水線,每個模型將結構化輸出傳遞給下一個模型。這恰好是 Baseten 旨在解決的基礎設施問題。當 NVIDIA 與 Baseten 分享 BioNeMo 工具包時,它提供了客户所缺少的生物學推理層。BioNeMo NIM 是領域特定的設計——不是為生物學調整的通用模型,而是從零開始為結構預測、分子生成和基因組學訓練的模型。將其與 Baseten 的推理基礎設施配對,意味着生命科學研究團隊可以端到端地運行完整的發現流水線,而無需自行搭建和管理底層的計算資源。

NVIDIA NIM 微服務是一種 Docker 容器,通過小型 HTTP API 提供單個模型的推理服務,其中包含了權重、CUDA 和服務堆棧。BioNeMo 是 NVIDIA 的 AI 驅動生物學和藥物發現平台,提供開放模型、庫、數據集、工具和用於科學 AI 工作負載的 NIM 微服務。BioNeMo 產品組合涵蓋三大類別:

  • 理解生物學:分析生物序列並識別生物學意義的模型,例如從原始序列映射分子3D形狀。示例包括 Evo 2。
  • 設計新療法:生成蛋白質、抗體和分子的模型,例如設計全新的功能性蛋白質以針對特定疾病。示例包括 RFdiffusion、ProteinMPNN、GenMol、MolMIM。
  • 預測結構和相互作用:預測生物分子行為和相互作用的模型,例如讀取序列以理解其特性、進化和功能。示例包括 OpenFold2、OpenFold3、Boltz2、DiffDock。

在 Baseten 上可用的 BioNeMo NIM 微服務總結在文章表格中。

除了容器,NVIDIA 還發布了 BioNeMo Skills。Skill 是一個為智能體編寫的 Markdown 規範,包含針對給定任務調用哪個端點、認證頭、確切的負載字段、如何解析響應以及常見錯誤的含義。每個模型對應一個 SKILL.md 文件和參考文件,兩個“元技能”將多個模型組合成完整的流水線。當智能體指向這些技能時,它可以自主決定摺疊序列意味着先收集比對再進行摺疊,正確格式化兩個負載,然後將數據從一個模型傳遞到下一個模型。因此,技能將一堆 HTTP 端點轉變為智能體可以端到端驅動並提供完整科學工作流的東西。

上下文對於結構模型運行至關重要。AlphaFold 類模型的準確率並非僅來自序列,而是來自進化。找到其他物種中數百個相關蛋白質並將其對齊,數百萬年來共同突變的列通常在3D中接觸。比對中的共進化信號是摺疊器讀取的主要內容,這就是為什麼單獨摺疊一個序列會得到明顯較差的結果。獲取上下文的全部工作由 MSA-Search 完成:GPU MMseqs2 在約1.4TB的參考數據庫上進行搜索,將之前需要數十分鐘到數小時的 CPU 搜索縮短到幾秒鐘內完成。

通過 BioNeMo 技能,智能體能夠自主執行蛋白質摺疊等流程。例如,智能體讀取元技能後,進行兩次調用:首先進行搜索獲取多序列比對,然後將比對文本作為輸入傳遞給摺疊模型。當輸入為兩條鏈的複合物時,智能體會選擇配對搜索而非標準搜索。它可以運行 OpenFold3 兩次,一次使用完整比對,一次使用單序列比對,然後讀取置信度分數並決定是否信任答案。這種決策能力正是 BioNeMo 技能所賦予的。

除了摺疊,BioNeMo Agent Toolkit 還支持更廣泛的科學工作流,包括蛋白質結合劑設計、虛擬篩選、基因組分析和靶點發現。這些工作流將孤立的模型調用轉變為完整的科學發現流水線。以藥物發現為例:GenMol 從支架生成候選分子,DiffDock 將每個候選分子與目標蛋白對齊並僅保留匹配的,Boltz2 預測每個分子的結合強度,最後智能體生成、對接、評分、排序並返回按預測效價排序的候選列表。

所有 BioNeMo NIM 微服務現已在 Baseten 模型庫中提供。開發者可以通過 Baseten 的 MCP 直接部署它們,並使用 Baseten Skills 進行調用。同樣的模式可以端到端地工作:智能體讀取技能,從庫中選擇正確的 NIM,部署它並開始調用。通過將 BioNeMo Agent Toolkit 在 Baseten 上提供,開發者可以快速部署和擴展科學 AI 工作負載,而無需管理模型服務、GPU 基礎設施或編排的複雜性。像 Benchling 這樣的團隊已經在生產中使用 Baseten 運行 BioNeMo 工作負載,加速從序列到結構再到候選的路徑。