Genesis Workbench:由Databricks和NVIDIA驅動的生命科學行業AI藍圖
Genesis Workbench是一個開放的Databricks藍圖,整合了NVIDIA的加速計算工具(包括BioNeMo和Parabricks),為端到端藥物發現提供安全、無程式碼的介面,透過Unity Catalog治理保護智慧財產權。
Genesis Workbench 是 Databricks 推出的一款開放式行業 AI 藍圖,旨在將輝達(NVIDIA)的加速計算工具(包括 BioNeMo 和 Parabricks)整合到一個統一、安全的環境中,實現端到端的藥物發現流程。該平臺透過 Unity Catalog 治理提供嚴格的智慧財產權保護,並配備無程式碼、點選式的介面,讓實驗科學家能夠直接執行基因組學和分子設計任務,而無需編寫程式碼。
傳統上,生命科學研發涉及大量非結構化、敏感資料,且各個學科(基因組學、轉錄組學、結構生物學、化學等)往往使用不同的工具鏈。Genesis Workbench 透過模組化設計解決這一難題:每個科學領域(如基因組學、單細胞、大分子、小分子以及 NVIDIA BioNeMo 模型微調)都是一個獨立可部署的模組,所有模組共享同一個平臺、治理模型和 MLflow 基礎架構,從而實現學科間的原生銜接。
平臺的核心優勢在於資料安全。所有模型和資料一次性下載到 Unity Catalog,推理在使用者工作區的 Model Serving 端點上執行,執行時無外部 API 依賴,確保智慧財產權始終處於受控的治理邊界內。同時,透過 Databricks AI Search 集中管理公共和專有資料集,消除了外部 API 依賴。
在加速研發方面,Genesis Workbench 利用 NVIDIA 的技術貫穿整個管線:基因組學階段使用 Parabricks 進行 GPU 加速的胚系變異檢測與註釋;單細胞階段採用 RAPIDS-singlecell 實現大規模聚類和差異表達;小分子設計藉助 GenMol 生成可合成的新分子;大分子設計則透過 Proteina-Complexa 進行蛋白質結合子設計與基序支架構建。此外,BioNeMo Recipes 支援在使用者資料上微調和執行預封裝模型。
平臺還提供 AI 輔助工作流生成和模型上下文協議(MCP)支援,使外部智慧體能夠呼叫其模型和工作流。未來路線圖包括自動化工作流生成、更多 NVIDIA AI 技能整合以及 MCP 服務擴充套件。
總之,Genesis Workbench 將 GPU 加速工具與統一治理相結合,為實驗科學家提供了從假設到候選藥物的完整管道,只有最高機率的靶點才會進入溼實驗室,從而顯著減少時間和資源浪費。該藍圖已開源,歡迎部署和貢獻。