NVIDIA BioNeMo Agent Toolkit が Baseten で利用可能に
NVIDIA BioNeMo Agent Toolkit は、汎用 AI エージェントを生物学や医薬品発見の実際のタスクを実行できる科学エージェントに変えるものです。このツールキットは、BioNeMo Skills、オープンモデル、NVIDIA NIM マイクロサービス、およびエージェントインフラストラクチャを組み合わせ、タンパク質構造予測、タンパク質設計、バーチャルスクリーニング、ゲノミクス解析、ターゲット発見などのワークフローを可能にします。すべての BioNeMo NIM マイクロサービスは Baseten モデルライブラリで利用可能であり、開発者は科学 AI アプリケーションを容易にデプロイおよびスケールできます。
NVIDIA BioNeMo Agent Toolkit が Baseten プラットフォーム上でリリースされ、汎用 AI エージェントを実際の生物学および創薬タスクを実行できる科学エージェントに変えることを目指しています。このツールキットは、BioNeMo Skills、オープンモデル、NVIDIA NIM マイクロサービス、およびエージェントインフラストラクチャを組み合わせ、タンパク質構造予測、タンパク質設計、バーチャルスクリーニング、ゲノミクス解析、ターゲット発見などのワークフローを可能にします。
科学 AI は、単一モデルの推論から、推論、計画、実行をマルチステップの科学タスクで行うエージェントワークフローへと進化しています。科学者は、科学文献を理解し、タンパク質構造を予測し、分子を設計し、ゲノムデータを分析し、治療標的を特定し、次の実験を推奨できる AI システムをますます必要としています。NVIDIA BioNeMo Agent Toolkit は、この新しい世代の AI 科学者を可能にするためのドメイン固有のツール、モデル、スキルを提供します。BioNeMo Skills、オープンモデル、NVIDIA NIM マイクロサービス、およびエージェントオーケストレーションインフラストラクチャを組み合わせることで、エージェントが「科学を読む」から「科学を行う」へと移行するのを支援します。
Baseten プラットフォームは、大規模にモデル推論を実行する必要があるチーム向けに構築されており、これらのチームはますますライフサイエンス分野のものになっています。エージェントワークフローへの移行は、「モデルを実行する」ことの意味を変えています。単一の呼び出しではなく、エージェントが専門モデルのパイプラインを調整し、各モデルが構造化出力を次のモデルに渡します。これはまさに Baseten が解決するために構築されたインフラ問題です。NVIDIA が Baseten と BioNeMo ツールキットを共有したとき、それは顧客に欠けていた生物学推論層を提供しました。BioNeMo NIM はドメイン固有に設計されています。生物学に適応された汎用モデルではなく、構造予測、分子生成、ゲノミクスのためにゼロからトレーニングされたモデルです。それを Baseten の推論インフラと組み合わせることで、ライフサイエンス研究チームは、基盤となる計算を自分で立ち上げて管理することなく、エンドツーエンドで完全な発見パイプラインを実行できます。
NVIDIA NIM マイクロサービスは、単一のモデルを小さな HTTP API の背後で提供する Docker コンテナであり、重み、CUDA、およびサービングスタックが組み込まれています。BioNeMo は、AI 駆動の生物学および創薬のための NVIDIA プラットフォームであり、科学 AI ワークロード向けのオープンモデル、ライブラリ、データセット、ツール、および NIM マイクロサービスを提供します。BioNeMo ポートフォリオは、次の3つの広範なカテゴリに及びます。
- 生物学の理解: 生物学的配列を分析し、生物学的意味を特定するモデル。例として、Evo 2。
- 新しい治療法の設計: タンパク質、抗体、分子を生成するモデル。例として、RFdiffusion、ProteinMPNN、GenMol、MolMIM。
- 構造と相互作用の予測: 生体分子の挙動と相互作用を予測するモデル。例として、OpenFold2、OpenFold3、Boltz2、DiffDock。
Baseten で利用可能な BioNeMo NIM マイクロサービスの一覧は、記事の表にまとめられています。
コンテナに加えて、NVIDIA は BioNeMo Skills も公開しています。Skill はエージェント向けに書かれた Markdown 仕様であり、特定のタスクに対してどのエンドポイントを呼び出すか、認証ヘッダー、正確なペイロードフィールド、レスポンスの解析方法、および一般的なエラーの意味を指示します。各モデルには1つの SKILL.md と参照ファイルが対応し、2つの「メタスキル」が複数のモデルを完全なパイプラインに構成します。エージェントがこれらのスキルを指すと、シーケンスを折りたたむことは最初にアライメントを収集してから折りたたむことを意味すると自律的に決定し、両方のペイロードを正しくフォーマットし、データをあるモデルから次のモデルに運びます。これにより、スキルは一連の HTTP エンドポイントを、エージェントがエンドツーエンドで駆動し、完全な科学ワークフローを提供できるものに変えます。
構造モデルを実行する前にコンテキストが必要です。AlphaFold クラスのモデルの精度は、配列だけから来るのではなく、進化から来ます。他の種にわたって数百の関連タンパク質を見つけて並べると、数百万年にわたって一緒に変異するカラムは通常3Dで接触しています。アライメント内の共進化シグナルはフォルダーが読み取るものの大部分であり、孤独な配列を折りたたむと著しく悪い結果が得られる理由です。コンテキストを収集する全作業は MSA-Search の仕事です。GPU MMseqs2 は約1.4TBの参照データベースを検索し、CPU で数十分から数時間かかっていた検索を数秒で完了します。
BioNeMo スキルを通じて、エージェントはタンパク質フォールディングなどのプロセスを自律的に実行できます。例えば、エージェントはメタスキルを読み、2回の呼び出しを行います。最初に検索してマルチプル配列アライメントを取得し、次にそのアライメントテキストをフォールディングモデルへの入力として渡します。入力が2つの鎖の複合体である場合、エージェントは標準検索ではなくペア検索を選択します。OpenFold3 を2回実行し、1回は完全アライメント、もう1回は単一配列アライメントで、信頼スコアを読み取って答えを信頼するかどうかを判断します。この意思決定が BioNeMo スキルによって可能になります。
フォールディングに加えて、BioNeMo Agent Toolkit は、タンパク質バインダー設計、バーチャルスクリーニング、ゲノミクス解析、ターゲット発見など、より広範な科学ワークフローをサポートします。これらのワークフローは、孤立したモデル呼び出しを完全な科学的発見パイプラインに変換します。創薬を例にとると、GenMol が足場から候補分子を生成し、DiffDock が各候補を標的タンパク質に整列させて適合するものだけを保持し、Boltz2 が各分子の結合強度を予測します。最後に、エージェントが生成、ドッキング、スコアリング、ソートを行い、予測効力でランク付けされた候補リストを返します。
すべての BioNeMo NIM マイクロサービスは Baseten モデルライブラリで今日から利用可能です。開発者は Baseten の MCP を通じて直接デプロイし、Baseten Skills を使って呼び出すことができます。そして、タンパク質を折りたたんだり薬剤候補をランク付けしたりするのと同じパターンがエンドツーエンドで機能します。エージェントがスキルを読み、ライブラリから適切な NIM を選び、デプロイして呼び出しを開始します。BioNeMo Agent Toolkit を Baseten で利用可能にすることで、開発者はモデルサービング、GPU インフラストラクチャ、オーケストレーションの複雑さを管理することなく、科学 AI ワークロードを迅速にデプロイおよびスケールできます。Benchling のようなチームは、すでに Baseten を使用して本番環境で BioNeMo ワークロードを実行し、配列から構造、候補への道筋を加速しています。