NVIDIA AI云生态系统全球扩展,满足全球AI计算需求
NVIDIA AI云生态系统正在全球加速建设AI工厂基础设施,合作伙伴扩展容量以满足企业、初创公司、国家、AI实验室和开发者对代理式AI应用的需求。这些云服务与NVIDIA全栈AI基础设施共同设计,支持训练、微调、推理、物理AI和主权AI部署。
NVIDIA AI云生态系统正加速全球AI工厂基础设施的构建。为满足企业、初创公司、国家、AI实验室及开发者对代理式AI应用日益增长的需求,合作伙伴不断扩展其容量。
NVIDIA AI云是一个不断增长的专业云生态系统,服务于当今最流行AI应用背后爆发的token需求。这些AI云与NVIDIA的全栈AI基础设施共同设计,以应对来自寻求新供应商和区域能力的企业、初创公司和国家的激增需求。它们结合了NVIDIA的加速计算、网络和AI软件,帮助合作伙伴支持训练、微调、推理、代理式AI、物理AI和主权AI部署。具体配置因合作伙伴和工作负载而异。
AI云合作伙伴选择NVIDIA以获得最佳经济性——最低的token成本和每瓦最佳吞吐量——以运行前沿和开源AI。这些云基于NVIDIA加速计算、网络和AI软件构建,将AI工厂带到更接近数据、开发者、用户和行业的地方,帮助客户大规模训练、调整和运行代理式AI应用。该生态系统几乎覆盖每个地理区域,为前沿模型构建者、企业、初创公司、软件提供商和国家AI项目提供区域和主权AI能力。
“每个公司和每个国家都需要AI工厂基础设施,将数据转化为智能,”NVIDIA创始人兼CEO黄仁勋表示。“NVIDIA AI云将全栈AI工厂带到更接近区域、行业和开发者的地方,这些开发者正在构建下一代AI,从模型训练到实时推理和AI代理,这将改变人们和组织的工作方式。”
广泛AI云生态系统:AI云提供商、电信公司、主权AI构建者和垂直整合基础设施提供商正在与NVIDIA合作建设AI工厂,服务于前沿AI、企业AI、电信、开发者云和国家AI项目。区域增长正在东南亚、澳大利亚和美洲加速。在非洲新增Cassava、南美新增Claro后,NVIDIA AI云现已覆盖六大洲。
合作伙伴包括CoreWeave、Firmus、IREN和Nscale等正在扩展AI基础设施,支持前沿模型开发、企业AI、代理应用和高容量推理。跨区域合作例如Firebird、GMI Cloud、Indosat Ooredoo Hutchison、Lambda、Naver Cloud、Sharon AI、Yotta和YTL正支持新兴AI公司、国家AI倡议、金融服务、电信、制造、教育、医疗和开发者生态系统。
对于政府和受监管行业,区域AI云可支持主权控制和本地合规要求。对于开发者和企业,它们可降低访问加速基础设施的摩擦,用于AI代理、企业副驾驶、数字工作者等必须靠近用户和数据运行的AI服务。
Firmus扩展AI工厂至澳大利亚和亚太:Firmus Technologies正通过Project Southgate在南澳大利亚和东南亚扩展AI工厂足迹,重点使用可再生能源、先进冷却和模块化基础设施。该公司已在通过合作伙伴ST Telemedia全球数据中心在新加坡部署AI基础设施。Firmus使用NVIDIA加速计算和参考架构,并借助NVIDIA DSX简化AI工厂设计、部署和运营。
“AI代理创造了新一类工业级token需求,亚太地区需要能够更快建设、更高效液冷并在千兆瓦规模运营的AI工厂,”Firmus联合CEO Tim Rosenfield说。“与NVIDIA一起,Firmus正在构建液冷AI基础设施,旨在尽可能高效快速地交付AI token给该地区最重要的客户。”
CoreWeave推进物理AI和下一代AI工厂:CoreWeave正在扩展其NVIDIA AI云平台以支持下一波代理式AI、物理AI和前沿模型工作负载。作为NVIDIA Vera Rubin和Vera CPU的早期采用者,CoreWeave也是首批采用NVIDIA Spectrum-X以太网光子学的公司之一,为百万GPU AI工厂提供网络基础。CoreWeave扩展其平台用于机器人和物理AI工作流,包括使用NVIDIA Cosmos 3帮助团队生成合成数据、微调模型和加速机器人数据飞轮。领先的AI实验室如Anthropic在CoreWeave的基础设施上构建前沿模型。
“AI工厂正在成为代理时代的基础,”CoreWeave联合创始人兼CEO Michael Intrator说。“与NVIDIA一起,CoreWeave正在构建全栈云基础设施,为AI实验室、企业和开发者提供他们所需性能、规模和可靠性,将前沿模型、AI代理和物理AI系统转化为生产应用。”
Nebius为代理工作流构建开放物理AI工作台:Nebius正在扩展其NVIDIA AI云,提供用于训练、推理和物理AI开发的全栈平台。作为NVIDIA Vera Rubin的早期采用者,Nebius正在构建从硅到软件的集成AI基础设施,包括其Nebius AI云、Token Factory推理层和新的物理AI工作台。该工作台将NVIDIA Cosmos 3、Isaac Sim和Isaac GR00T等技术组合成可组合的工作流,可由AI代理组装,帮助机器人和自主系统团队加速从模拟和合成数据到训练和评估的流程。
“开发者应该能够构建AI系统,而无需花费数周时间连接基础设施,”Nebius创始人兼CEO Arkady Volozh说。“通过NVIDIA,Nebius正在创建一种AI云,其中AI代理可以组合工具、数据和计算以加速AI工作负载——从机器人、生命科学到企业——从实验到生产。”
NVIDIA Exemplar Cloud势头:自去年NVIDIA推出Exemplar Cloud以来,已有六家NVIDIA云合作伙伴获得Exemplar Cloud状态:CoreWeave、Crusoe、Lambda、Nebius、Vultr和YTL。这一增长反映了对能够为生产AI工作负载提供一致性能、可靠性和效率的AI云基础设施的需求增加。这些提供商正在帮助提高AI云生态系统的性能标准,为企业、开发者和AI实验室提供更多经过验证的选项,用于扩展训练、推理和代理式AI服务。
为AI工厂经济性设计:随着AI从模型开发转向推理和高容量推理,基础设施的衡量标准不再仅仅是宣布的容量,还包括由平台利用率、正常运行时间、长资产寿命以及人们可以投入使用的有用AI代理的广度和深度所驱动的token输出经济性。NVIDIA全栈AI工厂平台上的AI云帮助合作伙伴优化这些指标。Token成本是总拥有成本指标,直接考虑硬件性能、软件优化、生态系统支持和实际利用率。NVIDIA提供行业最低的token成本,这得益于交付的token吞吐量、软件优化以及跨计算、网络、内存和存储的全栈协同设计。
DSX帮助AI云更快上线:NVIDIA AI云正在采用NVIDIA DSX平台来设计、构建和运营AI工厂。DSX整合了经过验证的参考设计、模拟、软件和生态系统技术,帮助云提供商更快上线、更高效运营并最大化收入。DSX Sim帮助团队在部署前建模和验证AI工厂。DSX Flex帮助AI工厂动态适应电网条件。DSX MaxLPS帮助受电力限制的AI工厂在固定电力预算内最大化计算,支持多达40%更多的GPU。DSX OS帮助自动化生命周期管理和大规模运营。DSX帮助AI云降低部署风险、提高弹性、每瓦提供更多token并实现最低的token成本。