AI News HubLIVE
站内改写

NVIDIA CEO黃仁勳在戴爾科技世界大會上表示:“需求呈拋物線式增長,完全呈拋物線式增長”

在戴爾科技世界大會上,戴爾和NVIDIA宣佈了新一代AI基礎設施,包括基於NVIDIA Vera Rubin NVL72的Dell PowerEdge XE9812,可將每個token的推理成本降低10倍。戴爾CEO邁克爾·戴爾表示,全球AI基礎設施支出到2030年可能達到3-4萬億美元,代幣消耗量增長3400%。NVIDIA CEO黃仁勳強調需求呈拋物線式增長。企業AI已從試點轉向大規模代理AI和推理部署。戴爾AI工廠與NVIDIA合作,提供從桌面到資料中心的全面AI解決方案,包括保密計算和開放模型支援。

文章情報

工程師進階

要點

  • 戴爾和NVIDIA推出基於Vera Rubin NVL72的新伺服器,推理成本降低10倍。
  • 戴爾CEO預測AI基礎設施支出將達到數萬億美元。
  • 企業AI進入代理時代,需安全部署前沿模型。
  • 戴爾AI工廠支援多種開放和專有模型,並整合保密計算。

為什麼重要

這條新聞值得關注,因為戴爾和NVIDIA推出基於Vera Rubin NVL72的新伺服器,推理成本降低10倍。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

在戴爾科技世界大會的主題演講中,戴爾董事長兼CEO邁克爾·戴爾與NVIDIA創始人兼CEO黃仁勳共同描繪了企業AI的未來圖景。戴爾指出,全球AI基礎設施支出到2030年可能高達3-4萬億美元,而token消耗量將增長3400%。黃仁勳則強調,AI需求正呈“完全拋物線式”增長,計算要求大幅提升。

戴爾宣佈推出新一代AI工廠——基於NVIDIA Vera Rubin NVL72的Dell PowerEdge XE9812,該伺服器可為大規模代理AI推理提供每個token成本降低10倍的效果。同時釋出的還有PowerEdge XE9880L、XE9885L和XE9882L,這些是首批基於NVIDIA HGX Rubin NVL8的戴爾系統,每機架支援多達144個GPU,效能最高達HGX B200的5.5倍。在網路方面,戴爾推出了配備NVIDIA Quantum-X800 InfiniBand和Spectrum-6乙太網的新PowerSwitch系列。

在CPU方面,Dell PowerEdge M9822和R9822伺服器引入了NVIDIA Vera CPU,其單執行緒效能為全球最高,記憶體頻寬達1.2 TB/s,代理工作負載比x86處理器快50%,企業資料查詢速度快3倍。Starburst資料引擎在Vera CPU上實現了3倍查詢吞吐量提升。

戴爾AI資料平臺與NVIDIA的更新重點在於基於CUDA-X庫的加速資料引擎,包括cuDF和cuVS。已有5000家企業(如禮來、三星、霍尼韋爾)在戴爾AI工廠上執行AI工作負載。霍尼韋爾技術長蘇雷什·文卡塔拉尤魯分享了該公司從公有云遷移至本地AI的經驗,強調了完整AI堆疊的安全性。

針對企業最關心的安全問題,戴爾和NVIDIA推出基於NVIDIA保密計算的解決方案,結合Fortanix、Google、Red Hat等合作伙伴,確保前沿模型在企業內部安全部署。Google Distributed Cloud with Gemini 3.0現已在Dell PowerEdge XE9780上預覽,並由NVIDIA Blackwell加速和保密計算保護。SpaceXAI也將把其模型引入戴爾AI工廠。

在開放模型方面,NVIDIA Nemotron、Reflection、MiniMax-M2.7、DeepSeek等模型均可在戴爾企業Hub上獲取。OpenAI Codex將連線戴爾AI資料平臺,使代理能訪問內部上下文。戴爾還宣佈了與Palantir、ServiceNow、Mistral AI等的新合作。

最貼近使用者的釋出是Dell Deskside Agentic AI,基於NVIDIA NemoClaw、OpenShell和Nemotron,執行在Dell Pro Max和Pro Precision系統上,支援從工作站到伺服器的代理構建與部署。NVIDIA AI-Q Blueprint為多代理工作流程提供參考。

戴爾營運長傑夫·克拉克將在大會第二天進一步深入Vera CPU、Vera Rubin、保密計算和Nemotron的細節,並進行現場演示。這些公告為NVIDIA在6月臺北國際電腦展上的釋出奠定了基礎。