NVIDIA BioNeMo Agent Toolkit:生体分子モデルをAIエージェントが呼び出し可能なスキルに変換し、創薬を支援
NVIDIAはオープンソースのBioNeMo Agent Toolkitを公開し、OpenFold3、DiffDock、GenMolなどの生体分子モデルをAIエージェントが呼び出し可能な文書化されたスキルに変換しました。各スキルはモデルの目的、入力、成果物、障害モードを記述し、エージェントが自律的に選択、実行、解釈できるようにします。Codex CLIとGPT-5.5 fastを用いたNVIDIAのベンチマークでは、スキルによってタスク完了率が57.1%から100%に向上し、トークン効率が2倍になりました。
AI科学者は科学計算の新しいインターフェースとなりつつあります。これらのエージェントは論文を読み、コードを書き、仮説を生成し、APIを呼び出し、ファイルを検査します。しかし、科学はソフトウェア工学とは異なります。仮説が正しいときに緑色に変わるテストスイートはありません。発見プロセスは依然として反復的で不確実であり、物理世界に根ざしています。
NVIDIAがこのギャップに対処するために、BioNeMo Agent Toolkitをリリースしました。NVIDIAは実践的なガイドを公開し、その主張は直接的です。生物学を対象とした一般的なコーディングエージェントは新しい医薬品を生み出しません。生体分子研究において、エージェントの上限は、それが確実に、正確に、効率的に使用できるツールによって決まります。
要するに、BioNeMo Agent ToolkitはNVIDIAの生体分子モデルを文書化された呼び出し可能なエージェントスキルとしてパッケージ化します。これらのスキルは、タンパク質フォールディング、分子ドッキング、生成化学、ゲノミクス解析、タンパク質設計をカバーします。NVIDIAは、スキルを使用することでタスク完了率が57.1%から100%に向上し、エージェントの1,000トークンあたりのアサーション通過数が平均で2倍になったと報告しています。ホスト型NIMエンドポイントは迅速なアクセスに適し、ローカルNIMは反復的な試行に適しています。
BioNeMo Agent Toolkitとは?これはAIエージェントのための「スキル」のオープンソースリポジトリです。各スキルはNVIDIAの生体分子モデルをエージェントが呼び出せるツールに変換します。ツールキットは、タンパク質フォールディング、分子ドッキング、生成化学、ゲノミクス解析、タンパク質設計、バイオマーカー発見をパッケージ化しています。
NVIDIAはプラットフォームを2つの部分に分けています。第一は加速ツール層です。NVIDIA NIM(NVIDIA Inference Microservices)とBioNeMoオープンモデルは、cuEquivariance(構造モデル用)やParabricks(ゲノミクス用)などのライブラリで加速されたコア機能を提供します。第二はエージェント対応インターフェースです。BioNeMo Skillsは各機能をパッケージ化し、エージェントが使用できるようにします。
スキルはモデルの目的、必須入力、オプションパラメータ、期待される成果物、障害モードを文書化します。Model Context Protocol(MCP)サーバーラッパーは、まだNIMとしてパッケージ化されていないオープンモデルを公開します。これにより、エージェントは生体分子モデルを自律的に発見、選択、呼び出し、解釈できます。
リポジトリはスキルをnim-skills、open-models-skills、library-skillsにグループ化しています。workflowsフォルダには、generative_protein_binder_design(RFdiffusion→ProteinMPNN→OpenFold3を連鎖)のような多段階メタスキルが含まれています。
スキルの動作方法:各スキルディレクトリにはSKILL.mdファイルがあり、YAMLフロントマターと指示、オプションの参照、オプションのスクリプトが含まれています。エージェントはこれをドキュメントとして読み、それに基づいて行動します。すべてのモデルで同じプロンプトパターンが使用されます。NVIDIAの投稿ではOpenFold3を例に挙げていますが、同じ形式がBoltz-2、DiffDock、GenMol、ProteinMPNN、MSA Search、RFdiffusion、Evo 2などの他の生物学用NIMにも適用されます。
インストールはオープンソースのスキルCLIを使用して行います:npx skills add NVIDIA-BioNeMo/bionemo-agent-toolkit、または個別のスキルをインストールすることもできます。デプロイメントには、インフラストラクチャを管理せずに高速アクセスできるホスト型NIMエンドポイントと、低レイテンシ、データローカリティ、反復的な試行に適したローカルNIMの2つのオプションがあります。
ベンチマークでは、Codex CLIとGPT-5.5 fastを使用し、スキルなしではタスク完了率が平均57.1%だったのに対し、NIMスキルを使用すると100%に達しました。効率面では、1,000トークンあたりのアサーション通過数が2倍になりました。
ユースケースには、タンパク質構造予測(Boltz-2またはOpenFold3でCIFファイルを返す)、マルチプルシーケンスアラインメント(MSA SearchでA3Mファイルを生成)、生成化学(GenMolでSDFまたはSMILESを出力)、タンパク質バインダー設計(RFdiffusion→ProteinMPNN→OpenFold3ワークフロー)が含まれます。各ループは同じパターンに従います。エージェントがモデルを選択し、入力を準備し、実行し、出力を検査し、注意事項を付けて結果を説明します。
スキルなしのエージェントとの比較:タスク完了率が57.1%から100%に向上、トークン効率が2倍、モデル選択が推測からドキュメント読み取りに、デプロイが手動設定からホスト型/ローカルNIMに、障害処理が未知から文書化に、ワークフローが単一呼び出しから多段階メタスキルに改善されました。
開始するには、ClaudeやCodexなどのエージェントランタイム、ホスト型エンドポイント用のNVIDIA APIキー、ローカルNIMデプロイメント用のGPUノード(オプション)が必要です。まずエージェントにリポジトリを列挙させ、その後で単一のスキルを割り当てることを推奨します。NVIDIAは、build.nvidia.comエンドポイントは小規模開発・テスト専用であり、プロダクション推論には不適切であること、また低信頼度構造の検証と生成分子のフィルタリングの重要性を強調しています。