AMD推出用于AI推理的PCIe GPU卡
AMD发布新款Instinct MI350P GPU,采用PCIe Gen 5接口,旨在让企业无需重建数据中心即可升级AI推理能力。该卡拥有1850亿晶体管、144GB HBM3e内存和600W热设计功耗,支持多达八卡配置和模型分区,并得到戴尔、技嘉等厂商支持。
AMD上周发布了其Instinct系列最新GPU——MI350P,该产品旨在让企业无需重建数据中心即可快速提升AI推理能力。MI350P采用标准PCIe Gen 5接口,可直接插入现有服务器的PCI总线,提供128GB/s的主机连接带宽。
MI350P拥有1850亿个晶体管、144GB HBM3e内存和4TB/s的峰值内存带宽,运行在600W热设计功耗内。它支持BF16、FP8、MXFP6和MXFP4精度,通过128个AMD CDNA第四代计算单元,在MXFP4精度下可提供高达4600峰值teraflops的性能。该GPU专为运行小型、中型和大型语言模型进行AI推理和检索增强生成(RAG)场景设计,可处理参数规模达2000亿至2500亿的AI模型,并支持视频和JPEG解码。
每个节点最多可配置八块MI350P GPU,且每块GPU可划分为四个分区,每个分区拥有36GB HBM3内存。AMD强调,该GPU采用标准风冷散热,无需液体冷却。AMD计算与企业AI业务开发主管Suresh Andani在博客中表示:“采用AI并不意味着从头重建基础设施。通过AMD Instinct MI350P PCIe卡,企业可以在现有数据中心内运行更多模型并为更多用户提供服务。”
MI350P获得了戴尔、技嘉等OEM厂商的支持。戴尔产品管理副总裁David Schmidt表示,新GPU将帮助客户更快推进AI计划:“对于认真对待AI的企业来说,本地基础设施不是妥协,而是竞争优势,它能提供控制力、安全性和可预测的结果。”技嘉总经理Daniel Hou也称赞该GPU的实用性:“PCIe设计使MI350P能够灵活部署并无缝集成到系统中,让企业能够构建高性能AI环境,并具备全球扩展所需的灵活性和效率。”
除了MI350P,AMD还在开发更高端的风冷GPU以及液冷型号。例如,Instinct UB B8是MI350X和MI355X系列的八GPU风冷配置,以通用基板形式交付,提供2.3TB HBM3和8TB/s内存带宽,并支持AMD Infinity Fabric用于扩展,AMD称其性能可与Nvidia Blackwell媲美。UB B8将支持参数高达5000亿的模型,专为大规模AI训练和推理设计。
AMD还提供液冷版Instinct MI355X,热设计功耗高达1400W,超微和TensorWave正与AMD合作支持这些液冷芯片。此外,AMD也有液冷版Radeon游戏GPU。
虽然市场上存在需要液冷甚至800V直流供电的超高端GPU,但许多客户希望在现有基础设施上运行稍小的AI模型,而不愿建造全新的数据中心。AMD的MI355P系列正是瞄准这一细分市场。