稀缺性正在推動硅谷以外的人工智能創新
隨着計算成本上升和能源限制加劇,傳統集中於硅谷等地的AI基礎設施正面臨挑戰。全球多個地區正利用本地資源建設自主AI基礎設施,如印度的Shakti Cloud、非洲的Cassava、巴西的SoberanIA和UAE的Core42。推理需求將重塑AI計算佈局,分散化基礎設施成為必需。
多年來,人工智能基礎設施的假設是,大型計算設施將建在超級雲、開發者密度和資本集中的地方:硅谷、西雅圖、倫敦等少數科技中心。這種地理集中有實際原因:大規模訓練和部署AI需要數據中心、計算能力、網絡容量、能源和先進基礎設施。這種依賴逐漸固化為市場集中——亞馬遜、微軟和谷歌合計佔全球企業雲基礎設施支出的近三分之二。
然而,這一舊邏輯已不再成立。計算變得越來越昂貴、能耗更高,且在少數主導提供商之外難以獲取。建設者們開始面臨這樣的問題:電力從何而來?芯片能否運送到此司法管轄區?數據一旦移動,適用哪國法律?這些問題的答案正越來越多地在硅谷之外找到。
稀缺性教會我們什麼 在成熟的雲市場中,應對不斷增長的AI需求的默認答案是增加更多容量:更大的雲合同、更密集的數據中心建設、更深的中央化堆棧依賴。2024年,數據中心消耗了全球約1.5%的電力,這足以使能源成為AI基礎設施的痛點之一。預計到2030年,這一比例將升至接近3%,使計算更難被視為AI產品背後的隱藏層。
在發展中世界,這種壓力是起點。建設者很少有機會將計算接入、電力和分配視為他人的問題;他們必須為此設計。結果,嚴重的AI基礎設施正在那些將稀缺性視為設計問題而非事後補救的地方建設。
這一模式在四處最為明顯:在印度,Yotta Data Services運營的Shakti Cloud擁有超過16,000塊Nvidia H100 GPU,並計劃增加更多。印度AI使命(政府構建本土基礎模型的計劃)超過一半的計算能力位於Yotta的硬件上。今年早些時候,多語言平台Bhashini從外國超級雲遷移到Shakti Cloud。Bhashini運行11種印度語言的實時翻譯,他們做出決定:無法治理的基礎設施是不可接受的。
在非洲,由津巴布韋企業家Strive Masiyiwa創立的Cassava Technologies正在南非、埃及、肯尼亞、摩洛哥和尼日利亞的數據中心部署12,000塊Nvidia GPU。Cassava是非洲大陸首家Nvidia雲合作伙伴;在此之前,Nvidia估計整個非洲大陸僅安裝了約80塊其GPU。限制不僅是定價,更是先進芯片的缺失。Cassava的應對之策是建設一個基於自有光纖骨幹網的泛非洲網絡,使非洲的初創公司、研究人員和政府無需通過歐洲或美國來訓練和部署AI。
在巴西,政府的SoberanIA項目在皮奧伊州預留了500兆瓦用於主權AI工廠,完全由可再生能源供電。Scala Data Centers是其主要基礎設施合作伙伴。巴西承諾在未來十年吸引高達3700億美元的數據中心投資,併為100%使用可再生能源的項目提供税收優惠。巴西約65%的數據仍存儲在海外。其賭注是豐富的水電和太陽能將為其主權計算提供比仍依賴天然氣或煤炭的市場更清潔的起點。
阿聯酋採取了最昂貴的路線。G42集團旗下的Core42銷售基於Nvidia和高通芯片的推理能力,阿聯酋已與美國合作,承諾建設一個10平方英里、5千兆瓦的AI園區,預計在本十年末部分投入運營。阿聯酋的提議直截了當:希望擁有主權AI但無法自行構建底層堆棧的國家,可以向友好政府租用。這是一種深思熟慮的垂直整合策略——一次性擁有芯片、電力、數據中心和外國關係。
這些項目都共享一個初始假設:計算接入、電力、土地和芯片供應是首要設計問題,而非外部因素。這一假設產生了不同的基礎設施。
為何推理改變地圖 訓練大型模型仍然需要密集集羣、大量資本和先進芯片。這項工作短期內不太可能離開最大的超大規模設施。
推理則不同。模型被客户、設備、代理和企業系統持續使用。麥肯錫預計,到2030年推理將超過訓練,成為AI數據中心的主要計算任務,佔AI計算的一半以上,以及數據中心需求的30%-40%。
對於推理,問題在於計算應位於何處、響應速度多快、工作負載如何可靠路由、以及數據受哪國法律管轄。這些問題具有地理影響,超大規模集中無法良好應對,尤其是對於數十億並非居住在美歐數據中心低延遲範圍內的人們。
推理需求所需的計算結構比超大規模雲單獨提供的更廣泛。分佈式GPU容量、區域推理集羣、主權雲以及孟買、內羅畢、聖保羅和阿布扎比等地新興的“新雲”並非超大規模的替代品——它們是超大規模自身無法服務的層。
舊AI基礎設施地圖是圍繞雲容量集中地繪製的。當計算廉價且充足時,這張地圖是有意義的。新地圖將有所不同。它將圍繞那些在計算昂貴且具有戰略意義時學會建設的地方繪製,並且在那裏,誰控制堆棧的問題更為重要。繪製新地圖的公司和政府並非在追趕硅谷;他們是因為不得不面對問題而率先抵達。