AI News HubLIVE
站內改寫3 分鐘閱讀

NVIDIA BioNeMo Agent Toolkit 在 Baseten 上釋出

NVIDIA BioNeMo Agent Toolkit 旨在將通用 AI 智慧體轉變為能夠執行真實生物學和藥物發現任務的科學智慧體。該工具包結合了 BioNeMo Skills、開放模型、NVIDIA NIM 微服務和智慧體基礎設施,支援蛋白質結構預測、蛋白質設計、虛擬篩選、基因組分析和靶點發現等流程。所有 BioNeMo NIM 微服務現已在 Baseten 模型庫中可用,方便開發者部署和擴充套件科學 AI 應用。

NVIDIA BioNeMo Agent Toolkit 於近日在 Baseten 平臺上釋出,旨在將通用 AI 智慧體轉變為能夠執行真實生物學和藥物發現任務的科學智慧體。該工具包結合了 BioNeMo Skills、開放模型、NVIDIA NIM 微服務和智慧體基礎設施,支援蛋白質結構預測、蛋白質設計、虛擬篩選、基因組分析和靶點發現等流程。

科學 AI 正在從孤立的模型推理向能夠推理、規劃並執行多步驟科學任務的智慧體工作流演進。科學家們越來越需要能夠理解科學文獻、預測蛋白質結構、設計分子、分析基因組資料、識別治療靶點並推薦下一步實驗的 AI 系統。NVIDIA BioNeMo Agent Toolkit 提供了實現新一代 AI 科學家所需的領域特定工具、模型和技能。它結合了 BioNeMo Skills、開放模型、NVIDIA NIM 微服務和智慧體編排基礎設施,幫助智慧體從“閱讀科學”轉變為“實踐科學”。

Baseten 平臺專為需要大規模執行模型推理的團隊構建,且這些團隊越來越多地來自生命科學領域。向智慧體工作流的轉變改變了“執行模型”的含義:不再是單個呼叫,而是智慧體編排一個由專門模型組成的流水線,每個模型將結構化輸出傳遞給下一個模型。這恰好是 Baseten 旨在解決的基礎設施問題。當 NVIDIA 與 Baseten 分享 BioNeMo 工具包時,它提供了客戶所缺少的生物學推理層。BioNeMo NIM 是領域特定的設計——不是為生物學調整的通用模型,而是從零開始為結構預測、分子生成和基因組學訓練的模型。將其與 Baseten 的推理基礎設施配對,意味著生命科學研究團隊可以端到端地執行完整的發現流水線,而無需自行搭建和管理底層的計算資源。

NVIDIA NIM 微服務是一種 Docker 容器,透過小型 HTTP API 提供單個模型的推理服務,其中包含了權重、CUDA 和服務堆疊。BioNeMo 是 NVIDIA 的 AI 驅動生物學和藥物發現平臺,提供開放模型、庫、資料集、工具和用於科學 AI 工作負載的 NIM 微服務。BioNeMo 產品組合涵蓋三大類別:

  • 理解生物學:分析生物序列並識別生物學意義的模型,例如從原始序列對映分子3D形狀。示例包括 Evo 2。
  • 設計新療法:生成蛋白質、抗體和分子的模型,例如設計全新的功能性蛋白質以針對特定疾病。示例包括 RFdiffusion、ProteinMPNN、GenMol、MolMIM。
  • 預測結構和相互作用:預測生物分子行為和相互作用的模型,例如讀取序列以理解其特性、進化和功能。示例包括 OpenFold2、OpenFold3、Boltz2、DiffDock。

在 Baseten 上可用的 BioNeMo NIM 微服務總結在文章表格中。

除了容器,NVIDIA 還發布了 BioNeMo Skills。Skill 是一個為智慧體編寫的 Markdown 規範,包含針對給定任務呼叫哪個端點、認證頭、確切的負載欄位、如何解析響應以及常見錯誤的含義。每個模型對應一個 SKILL.md 檔案和參考檔案,兩個“元技能”將多個模型組合成完整的流水線。當智慧體指向這些技能時,它可以自主決定摺疊序列意味著先收集比對再進行摺疊,正確格式化兩個負載,然後將資料從一個模型傳遞到下一個模型。因此,技能將一堆 HTTP 端點轉變為智慧體可以端到端驅動並提供完整科學工作流的東西。

上下文對於結構模型執行至關重要。AlphaFold 類模型的準確率並非僅來自序列,而是來自進化。找到其他物種中數百個相關蛋白質並將其對齊,數百萬年來共同突變的列通常在3D中接觸。比對中的共進化訊號是摺疊器讀取的主要內容,這就是為什麼單獨摺疊一個序列會得到明顯較差的結果。獲取上下文的全部工作由 MSA-Search 完成:GPU MMseqs2 在約1.4TB的參考資料庫上進行搜尋,將之前需要數十分鐘到數小時的 CPU 搜尋縮短到幾秒鐘內完成。

透過 BioNeMo 技能,智慧體能夠自主執行蛋白質摺疊等流程。例如,智慧體讀取元技能後,進行兩次呼叫:首先進行搜尋獲取多序列比對,然後將比對文本作為輸入傳遞給摺疊模型。當輸入為兩條鏈的複合物時,智慧體會選擇配對搜尋而非標準搜尋。它可以執行 OpenFold3 兩次,一次使用完整比對,一次使用單序列比對,然後讀取置信度分數並決定是否信任答案。這種決策能力正是 BioNeMo 技能所賦予的。

除了摺疊,BioNeMo Agent Toolkit 還支援更廣泛的科學工作流,包括蛋白質結合劑設計、虛擬篩選、基因組分析和靶點發現。這些工作流將孤立的模型呼叫轉變為完整的科學發現流水線。以藥物發現為例:GenMol 從支架生成候選分子,DiffDock 將每個候選分子與目標蛋白對齊並僅保留匹配的,Boltz2 預測每個分子的結合強度,最後智慧體生成、對接、評分、排序並返回按預測效價排序的候選列表。

所有 BioNeMo NIM 微服務現已在 Baseten 模型庫中提供。開發者可以透過 Baseten 的 MCP 直接部署它們,並使用 Baseten Skills 進行呼叫。同樣的模式可以端到端地工作:智慧體讀取技能,從庫中選擇正確的 NIM,部署它並開始呼叫。透過將 BioNeMo Agent Toolkit 在 Baseten 上提供,開發者可以快速部署和擴充套件科學 AI 工作負載,而無需管理模型服務、GPU 基礎設施或編排的複雜性。像 Benchling 這樣的團隊已經在生產中使用 Baseten 執行 BioNeMo 工作負載,加速從序列到結構再到候選的路徑。