2026-06-02 22:44 UTC+8站內改寫3 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AI突破雲端：Computex 2026的芯片需求信號

Computex 2026上，英偉達和高通展示了AI從雲端向邊緣設備遷移的趨勢，強調了AI代理在PC、手機等設備上運行的可能性，並討論了芯片需求格局的變化。

在今年的Computex 2026展會上，最引人注目的並非大量新產品發佈，而是AI運行位置的轉變。過去幾年，AI計算幾乎完全集中在雲端，大型語言模型在數據中心運行，用户僅通過瀏覽器或應用接收結果。然而，英偉達和高通在本屆展會上共同展示了一個不同的方向：未來的AI代理將不再侷限於雲端，而是擴展到PC、智能手機、工作站、機器人、汽車和工業設備等各種設備。這一變化的影響遠超“AI PC”概念，它將重塑GPU、CPU、DRAM、LPDDR、HBM、DPU、網絡、冷卻、封裝、基板和電力基礎設施等整個供應鏈的需求結構。

將代理帶到客户端設備

英偉達在展會上最重要的產品之一是與聯發科合作開發的Windows PC處理器N1X，以及基於該處理器的RTX Spark。這款產品並非簡單的AI PC芯片，而是將高性能AI代理本地運行的嘗試。英偉達表示，RTX Spark可提供約1 PFLOPS的AI性能，並在100萬上下文窗口中運行1200億參數的LLM。這意味着PC將不再是單純的“使用AI”的設備，而是成為運行AI模型、執行代理任務、處理個人數據的個人AI服務器。成功與否取決於兩個關鍵變量：一是以代理AI為前提的應用生態系統能否重新構建，二是與現有x86 Windows應用的兼容性能否順利解決。對於聯發科而言，這款產品對公司短期收入的貢獻可能不大（約1-2%），但有望提升其在Windows計算領域的影響力。

高通的願景：AI代理不限於單一設備

高通在主題演講中沒有發佈大型新產品，但暗示了將在6月分析師日發佈的Dragonfly AI服務器機架。值得注意的是，高通正進入推理專用ASIC和數據中心CPU領域，供應鏈顯示其ASIC可能面向字節跳動和一家美國超大規模客户，量產預計從2027年開始。高通CEO Cristiano Amon預測，2026至2030年間令牌消耗量將增長40倍，這意味AI推理需求將爆發。然而，高通認為並非所有推理都發生在雲端，代理AI工作負載將分佈在設備和雲端。例如，通過結合設備與雲端，編碼、網頁生成等任務可減少30-60%的令牌使用量並提高速度。這一觀點很重要：如果AI僅在雲端運行，受益者主要是GPU、HBM、網絡和電力基礎設施；而AI向邊緣擴展將推動智能手機、PC、內存等更多領域的需求，從而擴大AI半導體投資的版圖。

代理AI成為硬件堆棧問題

英偉達和高通在本屆展會上共同強調了代理AI。英偉達將AI代理分解為四個組成部分：LLM、大腦、工具/運行時、工作環境。這表明代理並非簡單的聊天機器人，而是需要模型調用工具、與外部交互、協調運行並反饋結果的結構，所需硬件也超越單一的GPU。英偉達指出，代理AI的硬件堆棧包括GPU、CPU和DPU。AI基礎設施不再是“購買更多GPU”，而是需要CPU準備數據、GPU計算、DPU管理網絡和數據移動，並輔以存儲、內存、冷卻和供電。英偉達正從單純的GPU公司轉型為AI工廠的全棧設計師，整合CUDA X庫、Nemotron模型、DPU、CPU、網絡、存儲和冷卻優化。與Cadence在芯片設計超級代理上的合作將驗證週期從數週縮短至數小時，加速40倍，表明代理AI能深入半導體設計等高價值產業。

Vera Rubin：GPU機架成為協同設計系統

英偉達確認Vera Rubin已投入量產，微軟、戴爾和CoreWeave已部署工程機架，大規模量產可能於第四季度開始。Vera Rubin的關鍵不僅僅是性能提升，而是整個機架成為協同設計的系統。Blackwell機架組裝約需2小時，而Vera Rubin通過減少電纜和風扇數量、採用液體冷卻和互連中板PCB，將組裝時間縮短至5分鐘。這一變化對供應鏈意義重大：AI服務器不再是簡單的GPU插卡，而是包含GPU、CPU、DPU、存儲、交換機、光通信、液體冷卻、電源、PCB等組件的高密度系統。Vera Rubin集成了Vera GPU、Vera CPU、BlueField DPU、存儲機架、共封裝光學Spectrum SPX機架和快速令牌處理的LPX，目標是將令牌處理量提升至GB300的10倍並最大化每瓦收入。瓶頸仍在於HBM4供應、CoWoS-L封裝、高級基板、液體冷卻和電力基礎設施，因此英偉達的強勢將帶動整個供應鏈受益，包括美國的台積電、安靠、ASE等，以及韓國的SK海力士、三星電子、三星電機、韓美半導體等。

Vera CPU：AI推理從GPU擴展到CPU

黃仁勳在展會上花大量時間介紹Vera CPU，將其定位為針對代理AI工作負載的專用CPU。據管理層稱，Vera CPU在代理AI沙箱性能上比x86領先1.8倍，並擁有世界頂級的IPC。技術上，Vera CPU支持PCIe 6和1.2TB/s LPDDR5X內存，提供3倍的內外部帶寬，峯值內存延遲降低40%。在數據庫工作負載中，SQL執行速度比x86快3倍。這表明在AI半導體市場中CPU將重新變得重要。過去幾年AI投資幾乎全部集中在GPU，但代理AI不僅需要模型推理，還需要數據查找、數據庫查詢、工具執行、沙箱代碼運行和並行任務管理，這些過程中CPU的作用再次凸顯。Vera CPU計劃於2026年下半年開始出貨，2026年60萬顆，2027年300萬顆。