AI News HubLIVE
站內改寫2 分鐘閱讀

NVIDIA與AWS合作,將AI大規模投入生產

NVIDIA與AWS合作,通過新的EC2 G7實例(搭載Blackwell GPU)和OpenSearch Serverless中的GPU加速向量索引(由cuVS驅動),以及AWS獲得NVIDIA GB300訓練的Exemplar雲狀態,為企業提供可擴展、低延遲的AI基礎設施。

來源NVIDIA Blog作者: Josiah Byers

構建大規模AI系統要求嚴苛,需要低延遲推理、快速向量搜索、優異的GPU性價比以及可擴展且不增加運營複雜性的基礎設施。NVIDIA與亞馬遜雲服務(AWS)的最新合作解決了這些挑戰。通過Amazon OpenSearch和Amazon EC2,NVIDIA AI基礎設施為企業提供了將AI投入生產規模的更實用路徑。

新的Amazon EC2 G7實例搭載NVIDIA RTX PRO 4500 Blackwell服務器版GPU,為AI推理、圖形、空間計算和GPU加速數據分析提供了新的實例類型。與G6實例相比,G7實例的AI推理性能提升高達4.6倍,圖形性能提升高達2.1倍,並通過NVIDIA cuDF庫在Amazon EMR上顯著加速數據分析。G7實例支持最多8個GPU、256GB總GPU內存、700 Gbps EFA網絡和高達7.6TB本地NVMe SSD存儲,提供1、2、4、8 GPU配置以及即將推出的裸機選項,允許客户根據工作負載精確配置基礎設施,避免過度配置。該平台的多樣性使AI團隊獲得更低延遲的推理,媒體和娛樂團隊獲得高分辨率視頻工作流和渲染,仿真、CAD、VDI、遊戲和空間計算團隊獲得圖形密集型應用,數據團隊則可利用GPU內存、本地存儲和網絡改進進行分析管道和向量數據庫工作負載。G7實例可通過AWS深度學習AMI、Amazon Deep Learning Containers、Amazon EMR、Amazon EKS、Amazon ECS和圖形AMI訪問,並即將支持Amazon SageMaker AI。

下一代Amazon OpenSearch Serverless為代理AI和動態工作負載提供無需基礎設施管理的支持。它默認使用NVIDIA cuVS驅動的GPU加速向量索引,用於所有向量集合。對於構建檢索增強生成、語義搜索、推薦系統和代理AI應用的團隊,這一轉變意義重大,將GPU驅動的向量搜索從專業優化項目轉變為標準AWS能力。實際影響是:向量索引速度提升高達10倍,成本僅為CPU構建的四分之一,使十億級向量數據庫在一小時內建成。通過將NVIDIA cuVS設為OpenSearch Serverless的默認選項,AWS客户獲得了從原始數據到生產就緒AI檢索基礎設施的更快路徑,且無服務器擴展減少了工作負載空閒時的運營開銷。

AWS已獲得NVIDIA GB300訓練的Exemplar雲狀態,意味着AWS達到了NVIDIA用於基準測試AI工作負載的嚴格性能閾值。這是AWS和NVIDIA團隊深度協同工程的結果。通過NVIDIA Exemplar雲計劃,開發者和AI領導者可以確信他們正在使用一致、高性能的雲基礎設施進行大規模訓練,幫助團隊更有信心地評估雲提供商,改善總體擁有成本,並更高效地將AI項目從規劃推進到生產。

這些進步強化了AWS上AI基礎設施棧的每一層。其主線是相同的:生產級AI基礎設施,能夠大規模運行,且不增加運營負擔。