2026-06-24 08:05 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-24 08:10 UTC+8

NVIDIA與AWS合作，將AI大規模投入生產

NVIDIA與AWS合作，通過新的EC2 G7實例（搭載Blackwell GPU）和OpenSearch Serverless中的GPU加速向量索引（由cuVS驅動），以及AWS獲得NVIDIA GB300訓練的Exemplar雲狀態，為企業提供可擴展、低延遲的AI基礎設施。

來源NVIDIA Blog作者: Josiah Byers

構建大規模AI系統要求嚴苛，需要低延遲推理、快速向量搜索、優異的GPU性價比以及可擴展且不增加運營複雜性的基礎設施。NVIDIA與亞馬遜雲服務（AWS）的最新合作解決了這些挑戰。通過Amazon OpenSearch和Amazon EC2，NVIDIA AI基礎設施為企業提供了將AI投入生產規模的更實用路徑。

新的Amazon EC2 G7實例搭載NVIDIA RTX PRO 4500 Blackwell服務器版GPU，為AI推理、圖形、空間計算和GPU加速數據分析提供了新的實例類型。與G6實例相比，G7實例的AI推理性能提升高達4.6倍，圖形性能提升高達2.1倍，並通過NVIDIA cuDF庫在Amazon EMR上顯著加速數據分析。G7實例支持最多8個GPU、256GB總GPU內存、700 Gbps EFA網絡和高達7.6TB本地NVMe SSD存儲，提供1、2、4、8 GPU配置以及即將推出的裸機選項，允許客户根據工作負載精確配置基礎設施，避免過度配置。該平台的多樣性使AI團隊獲得更低延遲的推理，媒體和娛樂團隊獲得高分辨率視頻工作流和渲染，仿真、CAD、VDI、遊戲和空間計算團隊獲得圖形密集型應用，數據團隊則可利用GPU內存、本地存儲和網絡改進進行分析管道和向量數據庫工作負載。G7實例可通過AWS深度學習AMI、Amazon Deep Learning Containers、Amazon EMR、Amazon EKS、Amazon ECS和圖形AMI訪問，並即將支持Amazon SageMaker AI。

下一代Amazon OpenSearch Serverless為代理AI和動態工作負載提供無需基礎設施管理的支持。它默認使用NVIDIA cuVS驅動的GPU加速向量索引，用於所有向量集合。對於構建檢索增強生成、語義搜索、推薦系統和代理AI應用的團隊，這一轉變意義重大，將GPU驅動的向量搜索從專業優化項目轉變為標準AWS能力。實際影響是：向量索引速度提升高達10倍，成本僅為CPU構建的四分之一，使十億級向量數據庫在一小時內建成。通過將NVIDIA cuVS設為OpenSearch Serverless的默認選項，AWS客户獲得了從原始數據到生產就緒AI檢索基礎設施的更快路徑，且無服務器擴展減少了工作負載空閒時的運營開銷。

AWS已獲得NVIDIA GB300訓練的Exemplar雲狀態，意味着AWS達到了NVIDIA用於基準測試AI工作負載的嚴格性能閾值。這是AWS和NVIDIA團隊深度協同工程的結果。通過NVIDIA Exemplar雲計劃，開發者和AI領導者可以確信他們正在使用一致、高性能的雲基礎設施進行大規模訓練，幫助團隊更有信心地評估雲提供商，改善總體擁有成本，並更高效地將AI項目從規劃推進到生產。

這些進步強化了AWS上AI基礎設施棧的每一層。其主線是相同的：生產級AI基礎設施，能夠大規模運行，且不增加運營負擔。