AI突破雲端:Computex 2026的芯片需求信號
Computex 2026上,英偉達和高通展示了AI從雲端向邊緣設備遷移的趨勢,強調了AI代理在PC、手機等設備上運行的可能性,並討論了芯片需求格局的變化。
在今年的Computex 2026展會上,最引人注目的並非大量新產品發佈,而是AI運行位置的轉變。過去幾年,AI計算幾乎完全集中在雲端,大型語言模型在數據中心運行,用户僅通過瀏覽器或應用接收結果。然而,英偉達和高通在本屆展會上共同展示了一個不同的方向:未來的AI代理將不再侷限於雲端,而是擴展到PC、智能手機、工作站、機器人、汽車和工業設備等各種設備。這一變化的影響遠超“AI PC”概念,它將重塑GPU、CPU、DRAM、LPDDR、HBM、DPU、網絡、冷卻、封裝、基板和電力基礎設施等整個供應鏈的需求結構。
- 將代理帶到客户端設備
英偉達在展會上最重要的產品之一是與聯發科合作開發的Windows PC處理器N1X,以及基於該處理器的RTX Spark。這款產品並非簡單的AI PC芯片,而是將高性能AI代理本地運行的嘗試。英偉達表示,RTX Spark可提供約1 PFLOPS的AI性能,並在100萬上下文窗口中運行1200億參數的LLM。這意味着PC將不再是單純的“使用AI”的設備,而是成為運行AI模型、執行代理任務、處理個人數據的個人AI服務器。成功與否取決於兩個關鍵變量:一是以代理AI為前提的應用生態系統能否重新構建,二是與現有x86 Windows應用的兼容性能否順利解決。對於聯發科而言,這款產品對公司短期收入的貢獻可能不大(約1-2%),但有望提升其在Windows計算領域的影響力。
- 高通的願景:AI代理不限於單一設備
高通在主題演講中沒有發佈大型新產品,但暗示了將在6月分析師日發佈的Dragonfly AI服務器機架。值得注意的是,高通正進入推理專用ASIC和數據中心CPU領域,供應鏈顯示其ASIC可能面向字節跳動和一家美國超大規模客户,量產預計從2027年開始。高通CEO Cristiano Amon預測,2026至2030年間令牌消耗量將增長40倍,這意味AI推理需求將爆發。然而,高通認為並非所有推理都發生在雲端,代理AI工作負載將分佈在設備和雲端。例如,通過結合設備與雲端,編碼、網頁生成等任務可減少30-60%的令牌使用量並提高速度。這一觀點很重要:如果AI僅在雲端運行,受益者主要是GPU、HBM、網絡和電力基礎設施;而AI向邊緣擴展將推動智能手機、PC、內存等更多領域的需求,從而擴大AI半導體投資的版圖。
- 代理AI成為硬件堆棧問題
英偉達和高通在本屆展會上共同強調了代理AI。英偉達將AI代理分解為四個組成部分:LLM、大腦、工具/運行時、工作環境。這表明代理並非簡單的聊天機器人,而是需要模型調用工具、與外部交互、協調運行並反饋結果的結構,所需硬件也超越單一的GPU。英偉達指出,代理AI的硬件堆棧包括GPU、CPU和DPU。AI基礎設施不再是“購買更多GPU”,而是需要CPU準備數據、GPU計算、DPU管理網絡和數據移動,並輔以存儲、內存、冷卻和供電。英偉達正從單純的GPU公司轉型為AI工廠的全棧設計師,整合CUDA X庫、Nemotron模型、DPU、CPU、網絡、存儲和冷卻優化。與Cadence在芯片設計超級代理上的合作將驗證週期從數週縮短至數小時,加速40倍,表明代理AI能深入半導體設計等高價值產業。
- Vera Rubin:GPU機架成為協同設計系統
英偉達確認Vera Rubin已投入量產,微軟、戴爾和CoreWeave已部署工程機架,大規模量產可能於第四季度開始。Vera Rubin的關鍵不僅僅是性能提升,而是整個機架成為協同設計的系統。Blackwell機架組裝約需2小時,而Vera Rubin通過減少電纜和風扇數量、採用液體冷卻和互連中板PCB,將組裝時間縮短至5分鐘。這一變化對供應鏈意義重大:AI服務器不再是簡單的GPU插卡,而是包含GPU、CPU、DPU、存儲、交換機、光通信、液體冷卻、電源、PCB等組件的高密度系統。Vera Rubin集成了Vera GPU、Vera CPU、BlueField DPU、存儲機架、共封裝光學Spectrum SPX機架和快速令牌處理的LPX,目標是將令牌處理量提升至GB300的10倍並最大化每瓦收入。瓶頸仍在於HBM4供應、CoWoS-L封裝、高級基板、液體冷卻和電力基礎設施,因此英偉達的強勢將帶動整個供應鏈受益,包括美國的台積電、安靠、ASE等,以及韓國的SK海力士、三星電子、三星電機、韓美半導體等。
- Vera CPU:AI推理從GPU擴展到CPU
黃仁勳在展會上花大量時間介紹Vera CPU,將其定位為針對代理AI工作負載的專用CPU。據管理層稱,Vera CPU在代理AI沙箱性能上比x86領先1.8倍,並擁有世界頂級的IPC。技術上,Vera CPU支持PCIe 6和1.2TB/s LPDDR5X內存,提供3倍的內外部帶寬,峯值內存延遲降低40%。在數據庫工作負載中,SQL執行速度比x86快3倍。這表明在AI半導體市場中CPU將重新變得重要。過去幾年AI投資幾乎全部集中在GPU,但代理AI不僅需要模型推理,還需要數據查找、數據庫查詢、工具執行、沙箱代碼運行和並行任務管理,這些過程中CPU的作用再次凸顯。Vera CPU計劃於2026年下半年開始出貨,2026年60萬顆,2027年300萬顆。