NVIDIA CEO黄仁勋在戴尔科技世界大会上表示:“需求呈抛物线式增长,完全呈抛物线式增长”
在戴尔科技世界大会上,戴尔和NVIDIA宣布了新一代AI基础设施,包括基于NVIDIA Vera Rubin NVL72的Dell PowerEdge XE9812,可将每个token的推理成本降低10倍。戴尔CEO迈克尔·戴尔表示,全球AI基础设施支出到2030年可能达到3-4万亿美元,代币消耗量增长3400%。NVIDIA CEO黄仁勋强调需求呈抛物线式增长。企业AI已从试点转向大规模代理AI和推理部署。戴尔AI工厂与NVIDIA合作,提供从桌面到数据中心的全面AI解决方案,包括保密计算和开放模型支持。
文章情报
要点
- 戴尔和NVIDIA推出基于Vera Rubin NVL72的新服务器,推理成本降低10倍。
- 戴尔CEO预测AI基础设施支出将达到数万亿美元。
- 企业AI进入代理时代,需安全部署前沿模型。
- 戴尔AI工厂支持多种开放和专有模型,并集成保密计算。
为什么重要
这条新闻值得关注,因为戴尔和NVIDIA推出基于Vera Rubin NVL72的新服务器,推理成本降低10倍。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
在戴尔科技世界大会的主题演讲中,戴尔董事长兼CEO迈克尔·戴尔与NVIDIA创始人兼CEO黄仁勋共同描绘了企业AI的未来图景。戴尔指出,全球AI基础设施支出到2030年可能高达3-4万亿美元,而token消耗量将增长3400%。黄仁勋则强调,AI需求正呈“完全抛物线式”增长,计算要求大幅提升。
戴尔宣布推出新一代AI工厂——基于NVIDIA Vera Rubin NVL72的Dell PowerEdge XE9812,该服务器可为大规模代理AI推理提供每个token成本降低10倍的效果。同时发布的还有PowerEdge XE9880L、XE9885L和XE9882L,这些是首批基于NVIDIA HGX Rubin NVL8的戴尔系统,每机架支持多达144个GPU,性能最高达HGX B200的5.5倍。在网络方面,戴尔推出了配备NVIDIA Quantum-X800 InfiniBand和Spectrum-6以太网的新PowerSwitch系列。
在CPU方面,Dell PowerEdge M9822和R9822服务器引入了NVIDIA Vera CPU,其单线程性能为全球最高,内存带宽达1.2 TB/s,代理工作负载比x86处理器快50%,企业数据查询速度快3倍。Starburst数据引擎在Vera CPU上实现了3倍查询吞吐量提升。
戴尔AI数据平台与NVIDIA的更新重点在于基于CUDA-X库的加速数据引擎,包括cuDF和cuVS。已有5000家企业(如礼来、三星、霍尼韦尔)在戴尔AI工厂上运行AI工作负载。霍尼韦尔首席技术官苏雷什·文卡塔拉尤鲁分享了该公司从公有云迁移至本地AI的经验,强调了完整AI堆栈的安全性。
针对企业最关心的安全问题,戴尔和NVIDIA推出基于NVIDIA保密计算的解决方案,结合Fortanix、Google、Red Hat等合作伙伴,确保前沿模型在企业内部安全部署。Google Distributed Cloud with Gemini 3.0现已在Dell PowerEdge XE9780上预览,并由NVIDIA Blackwell加速和保密计算保护。SpaceXAI也将把其模型引入戴尔AI工厂。
在开放模型方面,NVIDIA Nemotron、Reflection、MiniMax-M2.7、DeepSeek等模型均可在戴尔企业Hub上获取。OpenAI Codex将连接戴尔AI数据平台,使代理能访问内部上下文。戴尔还宣布了与Palantir、ServiceNow、Mistral AI等的新合作。
最贴近用户的发布是Dell Deskside Agentic AI,基于NVIDIA NemoClaw、OpenShell和Nemotron,运行在Dell Pro Max和Pro Precision系统上,支持从工作站到服务器的代理构建与部署。NVIDIA AI-Q Blueprint为多代理工作流程提供参考。
戴尔首席运营官杰夫·克拉克将在大会第二天进一步深入Vera CPU、Vera Rubin、保密计算和Nemotron的细节,并进行现场演示。这些公告为NVIDIA在6月台北国际电脑展上的发布奠定了基础。