AI News HubLIVE
站内改写3 分鐘閱讀

AI突破雲端:Computex 2026的晶片需求訊號

Computex 2026上,輝達和高通展示了AI從雲端向邊緣裝置遷移的趨勢,強調了AI代理在PC、手機等裝置上執行的可能性,並討論了晶片需求格局的變化。

來源Hacker News AI作者: haebom

在今年的Computex 2026展會上,最引人注目的並非大量新產品釋出,而是AI執行位置的轉變。過去幾年,AI計算幾乎完全集中在雲端,大型語言模型在資料中心執行,使用者僅透過瀏覽器或應用接收結果。然而,輝達和高通在本屆展會上共同展示了一個不同的方向:未來的AI代理將不再侷限於雲端,而是擴充套件到PC、智慧手機、工作站、機器人、汽車和工業裝置等各種裝置。這一變化的影響遠超“AI PC”概念,它將重塑GPU、CPU、DRAM、LPDDR、HBM、DPU、網路、冷卻、封裝、基板和電力基礎設施等整個供應鏈的需求結構。

  1. 將代理帶到客戶端裝置

輝達在展會上最重要的產品之一是與聯發科合作開發的Windows PC處理器N1X,以及基於該處理器的RTX Spark。這款產品並非簡單的AI PC晶片,而是將高效能AI代理本地執行的嘗試。輝達表示,RTX Spark可提供約1 PFLOPS的AI效能,並在100萬上下文視窗中執行1200億引數的LLM。這意味著PC將不再是單純的“使用AI”的裝置,而是成為執行AI模型、執行代理任務、處理個人資料的個人AI伺服器。成功與否取決於兩個關鍵變數:一是以代理AI為前提的應用生態系統能否重新構建,二是與現有x86 Windows應用的相容效能否順利解決。對於聯發科而言,這款產品對公司短期收入的貢獻可能不大(約1-2%),但有望提升其在Windows計算領域的影響力。

  1. 高通的願景:AI代理不限於單一裝置

高通在主題演講中沒有釋出大型新產品,但暗示了將在6月分析師日釋出的Dragonfly AI伺服器機架。值得注意的是,高通正進入推理專用ASIC和資料中心CPU領域,供應鏈顯示其ASIC可能面向字節跳動和一家美國超大規模客戶,量產預計從2027年開始。高通CEO Cristiano Amon預測,2026至2030年間令牌消耗量將增長40倍,這意味AI推理需求將爆發。然而,高通認為並非所有推理都發生在雲端,代理AI工作負載將分佈在裝置和雲端。例如,透過結合裝置與雲端,編碼、網頁生成等任務可減少30-60%的令牌使用量並提高速度。這一觀點很重要:如果AI僅在雲端執行,受益者主要是GPU、HBM、網路和電力基礎設施;而AI向邊緣擴充套件將推動智慧手機、PC、記憶體等更多領域的需求,從而擴大AI半導體投資的版圖。

  1. 代理AI成為硬體堆疊問題

輝達和高通在本屆展會上共同強調了代理AI。輝達將AI代理分解為四個組成部分:LLM、大腦、工具/執行時、工作環境。這表明代理並非簡單的聊天機器人,而是需要模型呼叫工具、與外部互動、協調執行並反饋結果的結構,所需硬體也超越單一的GPU。輝達指出,代理AI的硬體堆疊包括GPU、CPU和DPU。AI基礎設施不再是“購買更多GPU”,而是需要CPU準備資料、GPU計算、DPU管理網路和資料移動,並輔以儲存、記憶體、冷卻和供電。輝達正從單純的GPU公司轉型為AI工廠的全棧設計師,整合CUDA X庫、Nemotron模型、DPU、CPU、網路、儲存和冷卻最佳化。與Cadence在晶片設計超級代理上的合作將驗證週期從數週縮短至數小時,加速40倍,表明代理AI能深入半導體設計等高價值產業。

  1. Vera Rubin:GPU機架成為協同設計系統

輝達確認Vera Rubin已投入量產,微軟、戴爾和CoreWeave已部署工程機架,大規模量產可能於第四季度開始。Vera Rubin的關鍵不僅僅是效能提升,而是整個機架成為協同設計的系統。Blackwell機架組裝約需2小時,而Vera Rubin透過減少電纜和風扇數量、採用液體冷卻和互連中板PCB,將組裝時間縮短至5分鐘。這一變化對供應鏈意義重大:AI伺服器不再是簡單的GPU插卡,而是包含GPU、CPU、DPU、儲存、交換機、光通訊、液體冷卻、電源、PCB等元件的高密度系統。Vera Rubin整合了Vera GPU、Vera CPU、BlueField DPU、儲存機架、共封裝光學Spectrum SPX機架和快速令牌處理的LPX,目標是將令牌處理量提升至GB300的10倍並最大化每瓦收入。瓶頸仍在於HBM4供應、CoWoS-L封裝、高階基板、液體冷卻和電力基礎設施,因此輝達的強勢將帶動整個供應鏈受益,包括美國的臺積電、安靠、ASE等,以及韓國的SK海力士、三星電子、三星電機、韓美半導體等。

  1. Vera CPU:AI推理從GPU擴充套件到CPU

黃仁勳在展會上花大量時間介紹Vera CPU,將其定位為針對代理AI工作負載的專用CPU。據管理層稱,Vera CPU在代理AI沙箱效能上比x86領先1.8倍,並擁有世界頂級的IPC。技術上,Vera CPU支援PCIe 6和1.2TB/s LPDDR5X記憶體,提供3倍的內外部頻寬,峰值記憶體延遲降低40%。在資料庫工作負載中,SQL執行速度比x86快3倍。這表明在AI半導體市場中CPU將重新變得重要。過去幾年AI投資幾乎全部集中在GPU,但代理AI不僅需要模型推理,還需要資料查詢、資料庫查詢、工具執行、沙箱程式碼執行和並行任務管理,這些過程中CPU的作用再次凸顯。Vera CPU計劃於2026年下半年開始出貨,2026年60萬顆,2027年300萬顆。