2026-05-06 04:05 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

Astera轻声细语，手握巨剑

Astera Labs推出了名为Scorpio X的AI结构交换机，基于PCIe 6.0协议，提供320通道、5.12 TB/s双向带宽，作为Nvidia NVSwitch的供应商中立替代方案。该芯片支持网络内计算，包括针对混合专家模型（MoE）推理优化的多播操作Hypercast，旨在加速AI集群通信。样品现已提供，预计2026年下半年量产。

来源The Register AI + ML

Astera Labs在周二推出了一款替代Nvidia NVSwitch的AI系统机架级交换机，声称其几乎可兼容任何加速器。这款名为Scorpio X的AI结构芯片将320条PCIe 6.0通道集成到单个ASIC中，提供5.12 TB/s的双向带宽。

历史上，PCIe交换机已广泛应用于多种场景，包括横向扩展计算结构。单独的CPU无法提供足够或足够快的通道来连接所有GPU、NIC和存储设备，因此常通过内置在NIC中的PCIe交换机连接所有组件。Astera认为，只要交换机足够大，PCIe可以成为NVLink等互连技术的可行替代方案，用于将数十个或更多GPU组合成单个大型GPU的纵向扩展结构，而无需重新设计加速器。

然而，Astera并非仅仅构建了更大的PCIe交换机。Scorpio配备了与Nvidia NVSwitch相同的许多网络内计算能力，有助于加速集合通信。这些通信对于生成式AI推理尤为重要。随着混合专家（MoE）架构的流行，大型语言模型在网络方面变得非常“健谈”。MoE模型由多个称为专家的子模型组成，对于每个生成的token，可能使用不同的专家组合（可能运行在不同GPU上）。通过将集合通信移至交换机，GPU减少了等待网络的时间，从而能生成更多token。

Astera甚至开发了一种针对MoE推理优化的多播操作，称为Hypercast。Astera产品管理副总裁Ahmad Danesh向《The Register》表示：“标准多播的局限性之一是能支持的组数有限，以及对于MoE模型需要动态更改这些组。”

虽然使用PCIe作为芯片间互连有明确的优势，但Scorpio并非直接替代Nvidia的NVSwitch芯片。今年1月在CES上发布的NVSwitch 6提供近3倍的带宽（14.4 TB/s）。然而，Astera无需直接与NVSwitch竞争；实际上，Astera去年春天宣布计划扩展对Nvidia开放高速互连的NVLink Fusion的支持。相反，Scorpio定位为供应商中立的替代方案。NVLink Fusion或新兴的UALink协议正在获得关注，但芯片需要围绕它们设计。而PCIe几乎兼容所有设备，因为它已用于加速器的数据进出。例如，若想组合32个或更多Nvidia RTX Pro 6000服务器卡，需要PCIe交换机，因为这些GPU完全不支持NVLink。

PCIe还使得解聚推理架构中混合不同芯片更容易，正如Nvidia与Groq、AWS与Cerebras、Intel与SambaNova等合作所示。这些架构使用一个加速器进行计算密集的预填充操作，另一个用于带宽密集的解码操作，芯片之间必须互联。许多AI芯片厂商通过以太网实现，但PCIe更直接。

除Scorpio X系列芯片外，Astera还扩展了Scorpio P系列交换机，型号从32到320条PCIe通道不等。所有这些交换机均兼容其COSMOS管理套件，该硬件监控平台旨在帮助追踪和解决网络结构中的问题。Astera更新的Scorpio交换机现已提供样品，预计2026年下半年量产。