2026-06-02 22:44 UTC+8站内改写3 分钟阅读更新: 2026-06-30 21:03 UTC+8

AI突破云端：Computex 2026的芯片需求信号

Computex 2026上，英伟达和高通展示了AI从云端向边缘设备迁移的趋势，强调了AI代理在PC、手机等设备上运行的可能性，并讨论了芯片需求格局的变化。

在今年的Computex 2026展会上，最引人注目的并非大量新产品发布，而是AI运行位置的转变。过去几年，AI计算几乎完全集中在云端，大型语言模型在数据中心运行，用户仅通过浏览器或应用接收结果。然而，英伟达和高通在本届展会上共同展示了一个不同的方向：未来的AI代理将不再局限于云端，而是扩展到PC、智能手机、工作站、机器人、汽车和工业设备等各种设备。这一变化的影响远超“AI PC”概念，它将重塑GPU、CPU、DRAM、LPDDR、HBM、DPU、网络、冷却、封装、基板和电力基础设施等整个供应链的需求结构。

将代理带到客户端设备

英伟达在展会上最重要的产品之一是与联发科合作开发的Windows PC处理器N1X，以及基于该处理器的RTX Spark。这款产品并非简单的AI PC芯片，而是将高性能AI代理本地运行的尝试。英伟达表示，RTX Spark可提供约1 PFLOPS的AI性能，并在100万上下文窗口中运行1200亿参数的LLM。这意味着PC将不再是单纯的“使用AI”的设备，而是成为运行AI模型、执行代理任务、处理个人数据的个人AI服务器。成功与否取决于两个关键变量：一是以代理AI为前提的应用生态系统能否重新构建，二是与现有x86 Windows应用的兼容性能否顺利解决。对于联发科而言，这款产品对公司短期收入的贡献可能不大（约1-2%），但有望提升其在Windows计算领域的影响力。

高通的愿景：AI代理不限于单一设备

高通在主题演讲中没有发布大型新产品，但暗示了将在6月分析师日发布的Dragonfly AI服务器机架。值得注意的是，高通正进入推理专用ASIC和数据中心CPU领域，供应链显示其ASIC可能面向字节跳动和一家美国超大规模客户，量产预计从2027年开始。高通CEO Cristiano Amon预测，2026至2030年间令牌消耗量将增长40倍，这意味AI推理需求将爆发。然而，高通认为并非所有推理都发生在云端，代理AI工作负载将分布在设备和云端。例如，通过结合设备与云端，编码、网页生成等任务可减少30-60%的令牌使用量并提高速度。这一观点很重要：如果AI仅在云端运行，受益者主要是GPU、HBM、网络和电力基础设施；而AI向边缘扩展将推动智能手机、PC、内存等更多领域的需求，从而扩大AI半导体投资的版图。

代理AI成为硬件堆栈问题

英伟达和高通在本届展会上共同强调了代理AI。英伟达将AI代理分解为四个组成部分：LLM、大脑、工具/运行时、工作环境。这表明代理并非简单的聊天机器人，而是需要模型调用工具、与外部交互、协调运行并反馈结果的结构，所需硬件也超越单一的GPU。英伟达指出，代理AI的硬件堆栈包括GPU、CPU和DPU。AI基础设施不再是“购买更多GPU”，而是需要CPU准备数据、GPU计算、DPU管理网络和数据移动，并辅以存储、内存、冷却和供电。英伟达正从单纯的GPU公司转型为AI工厂的全栈设计师，整合CUDA X库、Nemotron模型、DPU、CPU、网络、存储和冷却优化。与Cadence在芯片设计超级代理上的合作将验证周期从数周缩短至数小时，加速40倍，表明代理AI能深入半导体设计等高价值产业。

Vera Rubin：GPU机架成为协同设计系统

英伟达确认Vera Rubin已投入量产，微软、戴尔和CoreWeave已部署工程机架，大规模量产可能于第四季度开始。Vera Rubin的关键不仅仅是性能提升，而是整个机架成为协同设计的系统。Blackwell机架组装约需2小时，而Vera Rubin通过减少电缆和风扇数量、采用液体冷却和互连中板PCB，将组装时间缩短至5分钟。这一变化对供应链意义重大：AI服务器不再是简单的GPU插卡，而是包含GPU、CPU、DPU、存储、交换机、光通信、液体冷却、电源、PCB等组件的高密度系统。Vera Rubin集成了Vera GPU、Vera CPU、BlueField DPU、存储机架、共封装光学Spectrum SPX机架和快速令牌处理的LPX，目标是将令牌处理量提升至GB300的10倍并最大化每瓦收入。瓶颈仍在于HBM4供应、CoWoS-L封装、高级基板、液体冷却和电力基础设施，因此英伟达的强势将带动整个供应链受益，包括美国的台积电、安靠、ASE等，以及韩国的SK海力士、三星电子、三星电机、韩美半导体等。

Vera CPU：AI推理从GPU扩展到CPU

黄仁勋在展会上花大量时间介绍Vera CPU，将其定位为针对代理AI工作负载的专用CPU。据管理层称，Vera CPU在代理AI沙箱性能上比x86领先1.8倍，并拥有世界顶级的IPC。技术上，Vera CPU支持PCIe 6和1.2TB/s LPDDR5X内存，提供3倍的内外部带宽，峰值内存延迟降低40%。在数据库工作负载中，SQL执行速度比x86快3倍。这表明在AI半导体市场中CPU将重新变得重要。过去几年AI投资几乎全部集中在GPU，但代理AI不仅需要模型推理，还需要数据查找、数据库查询、工具执行、沙箱代码运行和并行任务管理，这些过程中CPU的作用再次凸显。Vera CPU计划于2026年下半年开始出货，2026年60万颗，2027年300万颗。