2026-05-14 02:48 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

AMD推出用于AI推理的PCIe GPU卡

AMD发布新款Instinct MI350P GPU，采用PCIe Gen 5接口，旨在让企业无需重建数据中心即可升级AI推理能力。该卡拥有1850亿晶体管、144GB HBM3e内存和600W热设计功耗，支持多达八卡配置和模型分区，并得到戴尔、技嘉等厂商支持。

来源AIwire作者: Alex Woodie

AMD上周发布了其Instinct系列最新GPU——MI350P，该产品旨在让企业无需重建数据中心即可快速提升AI推理能力。MI350P采用标准PCIe Gen 5接口，可直接插入现有服务器的PCI总线，提供128GB/s的主机连接带宽。

MI350P拥有1850亿个晶体管、144GB HBM3e内存和4TB/s的峰值内存带宽，运行在600W热设计功耗内。它支持BF16、FP8、MXFP6和MXFP4精度，通过128个AMD CDNA第四代计算单元，在MXFP4精度下可提供高达4600峰值teraflops的性能。该GPU专为运行小型、中型和大型语言模型进行AI推理和检索增强生成（RAG）场景设计，可处理参数规模达2000亿至2500亿的AI模型，并支持视频和JPEG解码。

每个节点最多可配置八块MI350P GPU，且每块GPU可划分为四个分区，每个分区拥有36GB HBM3内存。AMD强调，该GPU采用标准风冷散热，无需液体冷却。AMD计算与企业AI业务开发主管Suresh Andani在博客中表示：“采用AI并不意味着从头重建基础设施。通过AMD Instinct MI350P PCIe卡，企业可以在现有数据中心内运行更多模型并为更多用户提供服务。”

MI350P获得了戴尔、技嘉等OEM厂商的支持。戴尔产品管理副总裁David Schmidt表示，新GPU将帮助客户更快推进AI计划：“对于认真对待AI的企业来说，本地基础设施不是妥协，而是竞争优势，它能提供控制力、安全性和可预测的结果。”技嘉总经理Daniel Hou也称赞该GPU的实用性：“PCIe设计使MI350P能够灵活部署并无缝集成到系统中，让企业能够构建高性能AI环境，并具备全球扩展所需的灵活性和效率。”

除了MI350P，AMD还在开发更高端的风冷GPU以及液冷型号。例如，Instinct UB B8是MI350X和MI355X系列的八GPU风冷配置，以通用基板形式交付，提供2.3TB HBM3和8TB/s内存带宽，并支持AMD Infinity Fabric用于扩展，AMD称其性能可与Nvidia Blackwell媲美。UB B8将支持参数高达5000亿的模型，专为大规模AI训练和推理设计。

AMD还提供液冷版Instinct MI355X，热设计功耗高达1400W，超微和TensorWave正与AMD合作支持这些液冷芯片。此外，AMD也有液冷版Radeon游戏GPU。

虽然市场上存在需要液冷甚至800V直流供电的超高端GPU，但许多客户希望在现有基础设施上运行稍小的AI模型，而不愿建造全新的数据中心。AMD的MI355P系列正是瞄准这一细分市场。