AI News HubLIVE
站内改写2 分钟阅读

NVIDIA与AWS合作,将AI大规模投入生产

NVIDIA与AWS合作,通过新的EC2 G7实例(搭载Blackwell GPU)和OpenSearch Serverless中的GPU加速向量索引(由cuVS驱动),以及AWS获得NVIDIA GB300训练的Exemplar云状态,为企业提供可扩展、低延迟的AI基础设施。

来源NVIDIA Blog作者: Josiah Byers

构建大规模AI系统要求严苛,需要低延迟推理、快速向量搜索、优异的GPU性价比以及可扩展且不增加运营复杂性的基础设施。NVIDIA与亚马逊云服务(AWS)的最新合作解决了这些挑战。通过Amazon OpenSearch和Amazon EC2,NVIDIA AI基础设施为企业提供了将AI投入生产规模的更实用路径。

新的Amazon EC2 G7实例搭载NVIDIA RTX PRO 4500 Blackwell服务器版GPU,为AI推理、图形、空间计算和GPU加速数据分析提供了新的实例类型。与G6实例相比,G7实例的AI推理性能提升高达4.6倍,图形性能提升高达2.1倍,并通过NVIDIA cuDF库在Amazon EMR上显著加速数据分析。G7实例支持最多8个GPU、256GB总GPU内存、700 Gbps EFA网络和高达7.6TB本地NVMe SSD存储,提供1、2、4、8 GPU配置以及即将推出的裸机选项,允许客户根据工作负载精确配置基础设施,避免过度配置。该平台的多样性使AI团队获得更低延迟的推理,媒体和娱乐团队获得高分辨率视频工作流和渲染,仿真、CAD、VDI、游戏和空间计算团队获得图形密集型应用,数据团队则可利用GPU内存、本地存储和网络改进进行分析管道和向量数据库工作负载。G7实例可通过AWS深度学习AMI、Amazon Deep Learning Containers、Amazon EMR、Amazon EKS、Amazon ECS和图形AMI访问,并即将支持Amazon SageMaker AI。

下一代Amazon OpenSearch Serverless为代理AI和动态工作负载提供无需基础设施管理的支持。它默认使用NVIDIA cuVS驱动的GPU加速向量索引,用于所有向量集合。对于构建检索增强生成、语义搜索、推荐系统和代理AI应用的团队,这一转变意义重大,将GPU驱动的向量搜索从专业优化项目转变为标准AWS能力。实际影响是:向量索引速度提升高达10倍,成本仅为CPU构建的四分之一,使十亿级向量数据库在一小时内建成。通过将NVIDIA cuVS设为OpenSearch Serverless的默认选项,AWS客户获得了从原始数据到生产就绪AI检索基础设施的更快路径,且无服务器扩展减少了工作负载空闲时的运营开销。

AWS已获得NVIDIA GB300训练的Exemplar云状态,意味着AWS达到了NVIDIA用于基准测试AI工作负载的严格性能阈值。这是AWS和NVIDIA团队深度协同工程的结果。通过NVIDIA Exemplar云计划,开发者和AI领导者可以确信他们正在使用一致、高性能的云基础设施进行大规模训练,帮助团队更有信心地评估云提供商,改善总体拥有成本,并更高效地将AI项目从规划推进到生产。

这些进步强化了AWS上AI基础设施栈的每一层。其主线是相同的:生产级AI基础设施,能够大规模运行,且不增加运营负担。