NVIDIA Cosmos 3:物理AIのためのオープン基盤モデル
NVIDIAは、物理推論、世界生成、アクション生成を統合したオープンソースの基盤モデルCosmos 3を発表。ロボット工学や自動運転などの物理AI開発を加速する。
物理AIシステムは、実際に行動する前に現実世界を理解する必要があります。ロボット、自動運転車、スマートスペースは、周囲で起こっていることを理解し、次に何が起こるかを予測し、特定の環境やエンティティ、タスクに合わせたアクションを生成できなければなりません。NVIDIA Cosmos 3は、物理推論、世界生成、アクション生成を単一のオープンモデルに統合した、物理AIのためのフロンティア基盤モデルです。
NVIDIAは、物理AI開発をよりオープンで再現可能にするために、Cosmos 3のモデル、トレーニングスクリプト、デプロイツール、データセットをオープンソース化しています。このブログ記事では、Cosmos 3の基礎、テクニカルレポートからの主要コンセプト、技術ワークフローのガイド、そしてロボットマニピュレーションシステムや自動運転車、倉庫監視ソリューションのチームがどのように始められるかを紹介しています。
図1は、Cosmos 3によって自動運転ドメイン向けに生成されたビデオのクリップです。