2026-06-24 08:05 UTC+8站内改写2 分钟阅读更新: 2026-06-24 08:10 UTC+8

NVIDIA与AWS合作，将AI大规模投入生产

NVIDIA与AWS合作，通过新的EC2 G7实例（搭载Blackwell GPU）和OpenSearch Serverless中的GPU加速向量索引（由cuVS驱动），以及AWS获得NVIDIA GB300训练的Exemplar云状态，为企业提供可扩展、低延迟的AI基础设施。

来源NVIDIA Blog作者: Josiah Byers

构建大规模AI系统要求严苛，需要低延迟推理、快速向量搜索、优异的GPU性价比以及可扩展且不增加运营复杂性的基础设施。NVIDIA与亚马逊云服务（AWS）的最新合作解决了这些挑战。通过Amazon OpenSearch和Amazon EC2，NVIDIA AI基础设施为企业提供了将AI投入生产规模的更实用路径。

新的Amazon EC2 G7实例搭载NVIDIA RTX PRO 4500 Blackwell服务器版GPU，为AI推理、图形、空间计算和GPU加速数据分析提供了新的实例类型。与G6实例相比，G7实例的AI推理性能提升高达4.6倍，图形性能提升高达2.1倍，并通过NVIDIA cuDF库在Amazon EMR上显著加速数据分析。G7实例支持最多8个GPU、256GB总GPU内存、700 Gbps EFA网络和高达7.6TB本地NVMe SSD存储，提供1、2、4、8 GPU配置以及即将推出的裸机选项，允许客户根据工作负载精确配置基础设施，避免过度配置。该平台的多样性使AI团队获得更低延迟的推理，媒体和娱乐团队获得高分辨率视频工作流和渲染，仿真、CAD、VDI、游戏和空间计算团队获得图形密集型应用，数据团队则可利用GPU内存、本地存储和网络改进进行分析管道和向量数据库工作负载。G7实例可通过AWS深度学习AMI、Amazon Deep Learning Containers、Amazon EMR、Amazon EKS、Amazon ECS和图形AMI访问，并即将支持Amazon SageMaker AI。

下一代Amazon OpenSearch Serverless为代理AI和动态工作负载提供无需基础设施管理的支持。它默认使用NVIDIA cuVS驱动的GPU加速向量索引，用于所有向量集合。对于构建检索增强生成、语义搜索、推荐系统和代理AI应用的团队，这一转变意义重大，将GPU驱动的向量搜索从专业优化项目转变为标准AWS能力。实际影响是：向量索引速度提升高达10倍，成本仅为CPU构建的四分之一，使十亿级向量数据库在一小时内建成。通过将NVIDIA cuVS设为OpenSearch Serverless的默认选项，AWS客户获得了从原始数据到生产就绪AI检索基础设施的更快路径，且无服务器扩展减少了工作负载空闲时的运营开销。

AWS已获得NVIDIA GB300训练的Exemplar云状态，意味着AWS达到了NVIDIA用于基准测试AI工作负载的严格性能阈值。这是AWS和NVIDIA团队深度协同工程的结果。通过NVIDIA Exemplar云计划，开发者和AI领导者可以确信他们正在使用一致、高性能的云基础设施进行大规模训练，帮助团队更有信心地评估云提供商，改善总体拥有成本，并更高效地将AI项目从规划推进到生产。

这些进步强化了AWS上AI基础设施栈的每一层。其主线是相同的：生产级AI基础设施，能够大规模运行，且不增加运营负担。