2026-06-02 22:44 UTC+8站內改寫3 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AI突破雲端：Computex 2026的晶片需求訊號

Computex 2026上，輝達和高通展示了AI從雲端向邊緣裝置遷移的趨勢，強調了AI代理在PC、手機等裝置上執行的可能性，並討論了晶片需求格局的變化。

在今年的Computex 2026展會上，最引人注目的並非大量新產品釋出，而是AI執行位置的轉變。過去幾年，AI計算幾乎完全集中在雲端，大型語言模型在資料中心執行，使用者僅透過瀏覽器或應用接收結果。然而，輝達和高通在本屆展會上共同展示了一個不同的方向：未來的AI代理將不再侷限於雲端，而是擴充套件到PC、智慧手機、工作站、機器人、汽車和工業裝置等各種裝置。這一變化的影響遠超“AI PC”概念，它將重塑GPU、CPU、DRAM、LPDDR、HBM、DPU、網路、冷卻、封裝、基板和電力基礎設施等整個供應鏈的需求結構。

將代理帶到客戶端裝置

輝達在展會上最重要的產品之一是與聯發科合作開發的Windows PC處理器N1X，以及基於該處理器的RTX Spark。這款產品並非簡單的AI PC晶片，而是將高效能AI代理本地執行的嘗試。輝達表示，RTX Spark可提供約1 PFLOPS的AI效能，並在100萬上下文視窗中執行1200億引數的LLM。這意味著PC將不再是單純的“使用AI”的裝置，而是成為執行AI模型、執行代理任務、處理個人資料的個人AI伺服器。成功與否取決於兩個關鍵變數：一是以代理AI為前提的應用生態系統能否重新構建，二是與現有x86 Windows應用的相容效能否順利解決。對於聯發科而言，這款產品對公司短期收入的貢獻可能不大（約1-2%），但有望提升其在Windows計算領域的影響力。

高通的願景：AI代理不限於單一裝置

高通在主題演講中沒有釋出大型新產品，但暗示了將在6月分析師日釋出的Dragonfly AI伺服器機架。值得注意的是，高通正進入推理專用ASIC和資料中心CPU領域，供應鏈顯示其ASIC可能面向字節跳動和一家美國超大規模客戶，量產預計從2027年開始。高通CEO Cristiano Amon預測，2026至2030年間令牌消耗量將增長40倍，這意味AI推理需求將爆發。然而，高通認為並非所有推理都發生在雲端，代理AI工作負載將分佈在裝置和雲端。例如，透過結合裝置與雲端，編碼、網頁生成等任務可減少30-60%的令牌使用量並提高速度。這一觀點很重要：如果AI僅在雲端執行，受益者主要是GPU、HBM、網路和電力基礎設施；而AI向邊緣擴充套件將推動智慧手機、PC、記憶體等更多領域的需求，從而擴大AI半導體投資的版圖。

代理AI成為硬體堆疊問題

輝達和高通在本屆展會上共同強調了代理AI。輝達將AI代理分解為四個組成部分：LLM、大腦、工具/執行時、工作環境。這表明代理並非簡單的聊天機器人，而是需要模型呼叫工具、與外部互動、協調執行並反饋結果的結構，所需硬體也超越單一的GPU。輝達指出，代理AI的硬體堆疊包括GPU、CPU和DPU。AI基礎設施不再是“購買更多GPU”，而是需要CPU準備資料、GPU計算、DPU管理網路和資料移動，並輔以儲存、記憶體、冷卻和供電。輝達正從單純的GPU公司轉型為AI工廠的全棧設計師，整合CUDA X庫、Nemotron模型、DPU、CPU、網路、儲存和冷卻最佳化。與Cadence在晶片設計超級代理上的合作將驗證週期從數週縮短至數小時，加速40倍，表明代理AI能深入半導體設計等高價值產業。

Vera Rubin：GPU機架成為協同設計系統

輝達確認Vera Rubin已投入量產，微軟、戴爾和CoreWeave已部署工程機架，大規模量產可能於第四季度開始。Vera Rubin的關鍵不僅僅是效能提升，而是整個機架成為協同設計的系統。Blackwell機架組裝約需2小時，而Vera Rubin透過減少電纜和風扇數量、採用液體冷卻和互連中板PCB，將組裝時間縮短至5分鐘。這一變化對供應鏈意義重大：AI伺服器不再是簡單的GPU插卡，而是包含GPU、CPU、DPU、儲存、交換機、光通訊、液體冷卻、電源、PCB等元件的高密度系統。Vera Rubin整合了Vera GPU、Vera CPU、BlueField DPU、儲存機架、共封裝光學Spectrum SPX機架和快速令牌處理的LPX，目標是將令牌處理量提升至GB300的10倍並最大化每瓦收入。瓶頸仍在於HBM4供應、CoWoS-L封裝、高階基板、液體冷卻和電力基礎設施，因此輝達的強勢將帶動整個供應鏈受益，包括美國的臺積電、安靠、ASE等，以及韓國的SK海力士、三星電子、三星電機、韓美半導體等。

Vera CPU：AI推理從GPU擴充套件到CPU

黃仁勳在展會上花大量時間介紹Vera CPU，將其定位為針對代理AI工作負載的專用CPU。據管理層稱，Vera CPU在代理AI沙箱效能上比x86領先1.8倍，並擁有世界頂級的IPC。技術上，Vera CPU支援PCIe 6和1.2TB/s LPDDR5X記憶體，提供3倍的內外部頻寬，峰值記憶體延遲降低40%。在資料庫工作負載中，SQL執行速度比x86快3倍。這表明在AI半導體市場中CPU將重新變得重要。過去幾年AI投資幾乎全部集中在GPU，但代理AI不僅需要模型推理，還需要資料查詢、資料庫查詢、工具執行、沙箱程式碼執行和並行任務管理，這些過程中CPU的作用再次凸顯。Vera CPU計劃於2026年下半年開始出貨，2026年60萬顆，2027年300萬顆。