AI突破云端:Computex 2026的芯片需求信号
Computex 2026上,英伟达和高通展示了AI从云端向边缘设备迁移的趋势,强调了AI代理在PC、手机等设备上运行的可能性,并讨论了芯片需求格局的变化。
在今年的Computex 2026展会上,最引人注目的并非大量新产品发布,而是AI运行位置的转变。过去几年,AI计算几乎完全集中在云端,大型语言模型在数据中心运行,用户仅通过浏览器或应用接收结果。然而,英伟达和高通在本届展会上共同展示了一个不同的方向:未来的AI代理将不再局限于云端,而是扩展到PC、智能手机、工作站、机器人、汽车和工业设备等各种设备。这一变化的影响远超“AI PC”概念,它将重塑GPU、CPU、DRAM、LPDDR、HBM、DPU、网络、冷却、封装、基板和电力基础设施等整个供应链的需求结构。
- 将代理带到客户端设备
英伟达在展会上最重要的产品之一是与联发科合作开发的Windows PC处理器N1X,以及基于该处理器的RTX Spark。这款产品并非简单的AI PC芯片,而是将高性能AI代理本地运行的尝试。英伟达表示,RTX Spark可提供约1 PFLOPS的AI性能,并在100万上下文窗口中运行1200亿参数的LLM。这意味着PC将不再是单纯的“使用AI”的设备,而是成为运行AI模型、执行代理任务、处理个人数据的个人AI服务器。成功与否取决于两个关键变量:一是以代理AI为前提的应用生态系统能否重新构建,二是与现有x86 Windows应用的兼容性能否顺利解决。对于联发科而言,这款产品对公司短期收入的贡献可能不大(约1-2%),但有望提升其在Windows计算领域的影响力。
- 高通的愿景:AI代理不限于单一设备
高通在主题演讲中没有发布大型新产品,但暗示了将在6月分析师日发布的Dragonfly AI服务器机架。值得注意的是,高通正进入推理专用ASIC和数据中心CPU领域,供应链显示其ASIC可能面向字节跳动和一家美国超大规模客户,量产预计从2027年开始。高通CEO Cristiano Amon预测,2026至2030年间令牌消耗量将增长40倍,这意味AI推理需求将爆发。然而,高通认为并非所有推理都发生在云端,代理AI工作负载将分布在设备和云端。例如,通过结合设备与云端,编码、网页生成等任务可减少30-60%的令牌使用量并提高速度。这一观点很重要:如果AI仅在云端运行,受益者主要是GPU、HBM、网络和电力基础设施;而AI向边缘扩展将推动智能手机、PC、内存等更多领域的需求,从而扩大AI半导体投资的版图。
- 代理AI成为硬件堆栈问题
英伟达和高通在本届展会上共同强调了代理AI。英伟达将AI代理分解为四个组成部分:LLM、大脑、工具/运行时、工作环境。这表明代理并非简单的聊天机器人,而是需要模型调用工具、与外部交互、协调运行并反馈结果的结构,所需硬件也超越单一的GPU。英伟达指出,代理AI的硬件堆栈包括GPU、CPU和DPU。AI基础设施不再是“购买更多GPU”,而是需要CPU准备数据、GPU计算、DPU管理网络和数据移动,并辅以存储、内存、冷却和供电。英伟达正从单纯的GPU公司转型为AI工厂的全栈设计师,整合CUDA X库、Nemotron模型、DPU、CPU、网络、存储和冷却优化。与Cadence在芯片设计超级代理上的合作将验证周期从数周缩短至数小时,加速40倍,表明代理AI能深入半导体设计等高价值产业。
- Vera Rubin:GPU机架成为协同设计系统
英伟达确认Vera Rubin已投入量产,微软、戴尔和CoreWeave已部署工程机架,大规模量产可能于第四季度开始。Vera Rubin的关键不仅仅是性能提升,而是整个机架成为协同设计的系统。Blackwell机架组装约需2小时,而Vera Rubin通过减少电缆和风扇数量、采用液体冷却和互连中板PCB,将组装时间缩短至5分钟。这一变化对供应链意义重大:AI服务器不再是简单的GPU插卡,而是包含GPU、CPU、DPU、存储、交换机、光通信、液体冷却、电源、PCB等组件的高密度系统。Vera Rubin集成了Vera GPU、Vera CPU、BlueField DPU、存储机架、共封装光学Spectrum SPX机架和快速令牌处理的LPX,目标是将令牌处理量提升至GB300的10倍并最大化每瓦收入。瓶颈仍在于HBM4供应、CoWoS-L封装、高级基板、液体冷却和电力基础设施,因此英伟达的强势将带动整个供应链受益,包括美国的台积电、安靠、ASE等,以及韩国的SK海力士、三星电子、三星电机、韩美半导体等。
- Vera CPU:AI推理从GPU扩展到CPU
黄仁勋在展会上花大量时间介绍Vera CPU,将其定位为针对代理AI工作负载的专用CPU。据管理层称,Vera CPU在代理AI沙箱性能上比x86领先1.8倍,并拥有世界顶级的IPC。技术上,Vera CPU支持PCIe 6和1.2TB/s LPDDR5X内存,提供3倍的内外部带宽,峰值内存延迟降低40%。在数据库工作负载中,SQL执行速度比x86快3倍。这表明在AI半导体市场中CPU将重新变得重要。过去几年AI投资几乎全部集中在GPU,但代理AI不仅需要模型推理,还需要数据查找、数据库查询、工具执行、沙箱代码运行和并行任务管理,这些过程中CPU的作用再次凸显。Vera CPU计划于2026年下半年开始出货,2026年60万颗,2027年300万颗。