AI News HubLIVE
サイト内リライト3 分で読了

NVIDIAとAWSが協力し、AIを本番規模で展開

NVIDIAとAWSは、Blackwell GPUを搭載した新しいEC2 G7インスタンス、cuVSを活用したOpenSearch ServerlessでのGPU加速ベクトルインデックス、そしてAWSがNVIDIA GB300トレーニングのExemplarクラウドステータスを取得することで、スケーラブルで低レイテンシのAIインフラを提供します。

ソースNVIDIA Blog著者: Josiah Byers

大規模なAIシステムの構築には、低レイテンシの推論、高速ベクトル検索、優れたGPUの価格性能比、そして運用の複雑さを増大させずに拡張できるインフラが必要です。NVIDIAとAmazon Web Services(AWS)の最新の協力は、これらの制約に対処します。Amazon OpenSearchとAmazon EC2全体で、NVIDIA AIインフラは企業にAIを本番規模で展開するためのより実用的な道を提供します。

新しいAmazon EC2 G7インスタンスは、NVIDIA RTX PRO 4500 Blackwell Server Edition GPUを搭載し、AI推論、グラフィックス、空間コンピューティング、GPUアクセラレーテッドデータ分析に対応します。G6インスタンスと比較して、G7は最大4.6倍のAI推論性能、最大2.1倍のグラフィックス性能、そしてNVIDIA cuDFライブラリを使用したAmazon EMRでのGPUアクセラレーテッドデータ分析を大幅に高速化します。G7インスタンスは最大8GPU、256GBの総GPUメモリ、700 GbpsのEFA対応ネットワーキング、最大7.6TBのローカルNVMe SSDストレージをサポートし、1、2、4、8 GPU構成と近日提供予定のベアメタルオプションを提供します。これにより、顧客はワークロードに合わせてインフラを適切にサイジングでき、過剰プロビジョニングを回避できます。このプラットフォームの汎用性により、AIチームは低レイテンシの推論を、メディアおよびエンターテイメントチームは高解像度ビデオワークフローとレンダリングを、シミュレーション、CAD、VDI、ゲーム、空間コンピューティングチームはグラフィックス集約型アプリケーションを、データチームはGPUメモリ、ローカルストレージ、ネットワーキングの改善を分析パイプラインとベクトルデータベースワークロードに活用できます。G7インスタンスは、AWS Deep Learning AMI、Amazon Deep Learning Containers、Amazon EMR、Amazon EKS、Amazon ECS、グラフィックスAMIを介してアクセス可能で、近日中にAmazon SageMaker AIでもサポートされる予定です。

次世代のAmazon OpenSearch Serverlessは、エージェンティックAIと動的ワークロードを、インフラ管理不要で実現します。NVIDIA cuVSを搭載したGPUアクセラレーテッドベクトルインデックスを、すべてのベクトルコレクションのデフォルト計算として使用します。検索拡張生成、セマンティック検索、レコメンデーションシステム、エージェンティックAIアプリケーションを構築するチームにとって、この移行は重要です。GPU駆動のベクトル検索を、特殊な最適化プロジェクトから標準のAWS機能に変えます。実際の影響は、ベクトルインデックスがCPUのみの構築と比較して最大10倍高速で、コストは4分の1になることです。これにより、数十億規模のベクトルデータベースを1時間以内に構築することが実用的になります。OpenSearch ServerlessでNVIDIA cuVSをデフォルトにすることで、AWS顧客は生データから本番対応のAI検索インフラへのより迅速なパスを得られ、サーバーレススケーリングによりワークロードがアイドル状態のときの運用オーバーヘッドが削減されます。

AWSは、NVIDIA GB300のトレーニングワークロードに対してNVIDIA Exemplarクラウドステータスを達成しました。これは、AWSがNVIDIAがリファレンスアーキテクチャに対してAIワークロードをベンチマークするために使用する厳格なパフォーマンスしきい値を満たしていることを意味します。この成果は、AWSとNVIDIAチーム間の深い共同エンジニアリングの結果です。NVIDIA Exemplarクラウドイニシアチブを通じて、開発者とAIリーダーは、大規模トレーニングに一貫した高パフォーマンスのクラウドインフラを使用していると確信できます。これにより、チームはクラウドプロバイダーをより確信を持って評価し、総所有コストを改善し、AIプロジェクトを計画から本番へより効率的に移行できます。

これらの進歩は、AWS上のAIインフラストラクチャスタックのすべての層を強化します。一貫したテーマは同じです:本番グレードのAIインフラが大規模にパフォーマンスを発揮し、それを実行するチームに運用負担を追加しないことです。