NVIDIA AI雲生態系統全球擴充套件,滿足全球AI計算需求
NVIDIA AI雲生態系統正在全球加速建設AI工廠基礎設施,合作伙伴擴充套件容量以滿足企業、初創公司、國家、AI實驗室和開發者對代理式AI應用的需求。這些雲服務與NVIDIA全棧AI基礎設施共同設計,支援訓練、微調、推理、物理AI和主權AI部署。
NVIDIA AI雲生態系統正加速全球AI工廠基礎設施的構建。為滿足企業、初創公司、國家、AI實驗室及開發者對代理式AI應用日益增長的需求,合作伙伴不斷擴充套件其容量。
NVIDIA AI雲是一個不斷增長的專業雲生態系統,服務於當今最流行AI應用背後爆發的token需求。這些AI雲與NVIDIA的全棧AI基礎設施共同設計,以應對來自尋求新供應商和區域能力的企業、初創公司和國家的激增需求。它們結合了NVIDIA的加速計算、網路和AI軟體,幫助合作伙伴支援訓練、微調、推理、代理式AI、物理AI和主權AI部署。具體配置因合作伙伴和工作負載而異。
AI雲合作伙伴選擇NVIDIA以獲得最佳經濟性——最低的token成本和每瓦最佳吞吐量——以執行前沿和開源AI。這些雲基於NVIDIA加速計算、網路和AI軟體構建,將AI工廠帶到更接近資料、開發者、使用者和行業的地方,幫助客戶大規模訓練、調整和執行代理式AI應用。該生態系統幾乎覆蓋每個地理區域,為前沿模型構建者、企業、初創公司、軟體提供商和國家AI專案提供區域和主權AI能力。
“每個公司和每個國家都需要AI工廠基礎設施,將資料轉化為智慧,”NVIDIA創始人兼CEO黃仁勳表示。“NVIDIA AI雲將全棧AI工廠帶到更接近區域、行業和開發者的地方,這些開發者正在構建下一代AI,從模型訓練到即時推理和AI代理,這將改變人們和組織的工作方式。”
廣泛AI雲生態系統:AI雲提供商、電信公司、主權AI構建者和垂直整合基礎設施提供商正在與NVIDIA合作建設AI工廠,服務於前沿AI、企業AI、電信、開發者雲和國家AI專案。區域增長正在東南亞、澳大利亞和美洲加速。在非洲新增Cassava、南美新增Claro後,NVIDIA AI雲現已覆蓋六大洲。
合作伙伴包括CoreWeave、Firmus、IREN和Nscale等正在擴充套件AI基礎設施,支援前沿模型開發、企業AI、代理應用和高容量推理。跨區域合作例如Firebird、GMI Cloud、Indosat Ooredoo Hutchison、Lambda、Naver Cloud、Sharon AI、Yotta和YTL正支援新興AI公司、國家AI倡議、金融服務、電信、製造、教育、醫療和開發者生態系統。
對於政府和受監管行業,區域AI雲可支援主權控制和本地合規要求。對於開發者和企業,它們可降低訪問加速基礎設施的摩擦,用於AI代理、企業副駕駛、數字工作者等必須靠近使用者和資料執行的AI服務。
Firmus擴充套件AI工廠至澳大利亞和亞太:Firmus Technologies正透過Project Southgate在南澳大利亞和東南亞擴充套件AI工廠足跡,重點使用可再生能源、先進冷卻和模組化基礎設施。該公司已在透過合作伙伴ST Telemedia全球資料中心在新加坡部署AI基礎設施。Firmus使用NVIDIA加速計算和參考架構,並藉助NVIDIA DSX簡化AI工廠設計、部署和運營。
“AI代理創造了新一類工業級token需求,亞太地區需要能夠更快建設、更高效液冷並在千兆瓦規模運營的AI工廠,”Firmus聯合CEO Tim Rosenfield說。“與NVIDIA一起,Firmus正在構建液冷AI基礎設施,旨在儘可能高效快速地交付AI token給該地區最重要的客戶。”
CoreWeave推進物理AI和下一代AI工廠:CoreWeave正在擴充套件其NVIDIA AI雲平臺以支援下一波代理式AI、物理AI和前沿模型工作負載。作為NVIDIA Vera Rubin和Vera CPU的早期採用者,CoreWeave也是首批採用NVIDIA Spectrum-X乙太網光子學的公司之一,為百萬GPU AI工廠提供網路基礎。CoreWeave擴充套件其平臺用於機器人和物理AI工作流,包括使用NVIDIA Cosmos 3幫助團隊生成合成資料、微調模型和加速機器人資料飛輪。領先的AI實驗室如Anthropic在CoreWeave的基礎設施上構建前沿模型。
“AI工廠正在成為代理時代的基礎,”CoreWeave聯合創始人兼CEO Michael Intrator說。“與NVIDIA一起,CoreWeave正在構建全棧雲基礎設施,為AI實驗室、企業和開發者提供他們所需效能、規模和可靠性,將前沿模型、AI代理和物理AI系統轉化為生產應用。”
Nebius為代理工作流構建開放物理AI工作臺:Nebius正在擴充套件其NVIDIA AI雲,提供用於訓練、推理和物理AI開發的全棧平臺。作為NVIDIA Vera Rubin的早期採用者,Nebius正在構建從矽到軟體的整合AI基礎設施,包括其Nebius AI雲、Token Factory推理層和新的物理AI工作臺。該工作臺將NVIDIA Cosmos 3、Isaac Sim和Isaac GR00T等技術組合成可組合的工作流,可由AI代理組裝,幫助機器人和自主系統團隊加速從模擬和合成資料到訓練和評估的流程。
“開發者應該能夠構建AI系統,而無需花費數週時間連線基礎設施,”Nebius創始人兼CEO Arkady Volozh說。“透過NVIDIA,Nebius正在建立一種AI雲,其中AI代理可以組合工具、資料和計算以加速AI工作負載——從機器人、生命科學到企業——從實驗到生產。”
NVIDIA Exemplar Cloud勢頭:自去年NVIDIA推出Exemplar Cloud以來,已有六家NVIDIA雲合作伙伴獲得Exemplar Cloud狀態:CoreWeave、Crusoe、Lambda、Nebius、Vultr和YTL。這一增長反映了對能夠為生產AI工作負載提供一致效能、可靠性和效率的AI雲基礎設施的需求增加。這些提供商正在幫助提高AI雲生態系統的效能標準,為企業、開發者和AI實驗室提供更多經過驗證的選項,用於擴充套件訓練、推理和代理式AI服務。
為AI工廠經濟性設計:隨著AI從模型開發轉向推理和高容量推理,基礎設施的衡量標準不再僅僅是宣佈的容量,還包括由平臺利用率、正常執行時間、長資產壽命以及人們可以投入使用的有用AI代理的廣度和深度所驅動的token輸出經濟性。NVIDIA全棧AI工廠平臺上的AI雲幫助合作伙伴最佳化這些指標。Token成本是總擁有成本指標,直接考慮硬體效能、軟體最佳化、生態系統支援和實際利用率。NVIDIA提供行業最低的token成本,這得益於交付的token吞吐量、軟體最佳化以及跨計算、網路、記憶體和儲存的全棧協同設計。
DSX幫助AI雲更快上線:NVIDIA AI雲正在採用NVIDIA DSX平臺來設計、構建和運營AI工廠。DSX整合了經過驗證的參考設計、模擬、軟體和生態系統技術,幫助雲提供商更快上線、更高效運營並最大化收入。DSX Sim幫助團隊在部署前建模和驗證AI工廠。DSX Flex幫助AI工廠動態適應電網條件。DSX MaxLPS幫助受電力限制的AI工廠在固定電力預算內最大化計算,支援多達40%更多的GPU。DSX OS幫助自動化生命週期管理和大規模運營。DSX幫助AI雲降低部署風險、提高彈性、每瓦提供更多token並實現最低的token成本。