NVIDIA、自動運転、ロボティクス、ビジョンAIのためのエージェントスキルで物理AI研究の新時代を実現
CVPR 2026で、NVIDIAは自動運転車、ロボット、ビジョンAIシステムの開発を加速する新しい物理AIエージェントスキルを発表しました。これらのスキルはNVIDIA Cosmos 3、シミュレーションフレームワーク、ライブラリと統合され、シーン再構築からポリシートレーニングまでのワークフローを自動化します。主な進歩には、Neural Reconstruction、AlpaGym、OmniDreams、欠陥生成のためのMetropolisスキル、Isaac Simの新しいロボティクスツールが含まれます。NVIDIAはまた、Alpamayo 2 SuperのようなオープンモデルやGRAILのようなデータセットをリリースしました。
CVPR 2026において、NVIDIAは物理AI研究のための新しいエージェントスキルを発表しました。これにより、自動運転車、ロボット、ビジョンAIシステムの開発が加速されます。物理AI研究の核心的な課題は、より強力なモデルを開発することではなく、その周りに完全なワークフローを構築することです。現実世界のシーン再構築、エッジケースシナリオの生成、ポリシートレーニング、動作評価、迅速な反復など、これらのステップは現在別々のツールに断片化されており、実験のペースを遅らせています。
NVIDIA Cosmos 3は、ビジョン推論、世界生成、アクション生成を統合した初の完全なオムニモデルであり、物理AIのコア機能を提供します。新しい物理AIエージェントスキルはCosmos 3、NVIDIAライブラリ、シミュレーションフレームワークと連携し、研究者がモデル機能からスケーラブルなエンドツーエンドワークフローへと迅速に移行できるようにします。
自動運転研究では、Neural Reconstructionスキルがフリートデータを編集可能な3Dシーンに変換します。AlpaGymはオープンソースの閉ループ強化学習フレームワークで、数千GPUにわたるポリシーロールアウトとシミュレーションを拡張します。OmniDreamsはアクション条件付き生成ワールドモデルで、シミュレーションループにフォトリアリスティックレンダリングを追加します。さらに、Alpamayo 2 Superは320億パラメータのオープンVLAモデルであり、ドライビングスタック全体を推論、計画、実行します。
ビジョンAI向けには、新しいMetropolisスキルがAIエージェントを使用して合成視覚シナリオを生成します。欠陥画像生成スキルは、実画像を使用して異なる表面にさまざまな欠陥の例を作成できます。ビデオ検索と要約(VSS)スキルは、大量のビデオデータから洞察を抽出します。
ロボティクスでは、Isaac Sim 6.0がエージェントフレンドリーなスキルとコネクタを提供し、シーン準備、シミュレーション、ロボット学習の一般的な開発ステップを自動化します。Isaac Labスキルは強化学習のセットアップ、トレーニング、評価をサポートします。移動スキルはナビゲーションワークフローを自動化し、Cosmos-H-Surgical-Simulatorは手術ロボット研究のための現実的なデータを生成します。
NVIDIAの技術はCVPR 2026の大多数の論文で参照され、研究チームはAI CityチャレンジやPAI-AV推論チャレンジなどのオープン研究コンテストを主催しました。物理AIデータセットのHugging Faceでのダウンロード数は1500万を超え、GRAILなどの新データセットもリリースされています。これらのエージェントツールとスキルはGitHubで公開され、NVIDIA Brevで物理AI Launchablesとして即座に試用できます。