2026-05-14 02:48 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

AMD推出用於AI推理的PCIe GPU卡

AMD釋出新款Instinct MI350P GPU，採用PCIe Gen 5介面，旨在讓企業無需重建資料中心即可升級AI推理能力。該卡擁有1850億電晶體、144GB HBM3e記憶體和600W熱設計功耗，支援多達八卡配置和模型分割槽，並得到戴爾、技嘉等廠商支援。

來源AIwire作者: Alex Woodie

AMD上週釋出了其Instinct系列最新GPU——MI350P，該產品旨在讓企業無需重建資料中心即可快速提升AI推理能力。MI350P採用標準PCIe Gen 5介面，可直接插入現有伺服器的PCI匯流排，提供128GB/s的主機連線頻寬。

MI350P擁有1850億個電晶體、144GB HBM3e記憶體和4TB/s的峰值記憶體頻寬，執行在600W熱設計功耗內。它支援BF16、FP8、MXFP6和MXFP4精度，透過128個AMD CDNA第四代計算單元，在MXFP4精度下可提供高達4600峰值teraflops的效能。該GPU專為執行小型、中型和大型語言模型進行AI推理和檢索增強生成（RAG）場景設計，可處理引數規模達2000億至2500億的AI模型，並支援影片和JPEG解碼。

每個節點最多可配置八塊MI350P GPU，且每塊GPU可劃分為四個分割槽，每個分割槽擁有36GB HBM3記憶體。AMD強調，該GPU採用標準風冷散熱，無需液體冷卻。AMD計算與企業AI業務開發主管Suresh Andani在部落格中表示：“採用AI並不意味著從頭重建基礎設施。透過AMD Instinct MI350P PCIe卡，企業可以在現有資料中心內執行更多模型併為更多使用者提供服務。”

MI350P獲得了戴爾、技嘉等OEM廠商的支援。戴爾產品管理副總裁David Schmidt表示，新GPU將幫助客戶更快推進AI計劃：“對於認真對待AI的企業來說，本地基礎設施不是妥協，而是競爭優勢，它能提供控制力、安全性和可預測的結果。”技嘉總經理Daniel Hou也稱讚該GPU的實用性：“PCIe設計使MI350P能夠靈活部署並無縫整合到系統中，讓企業能夠構建高效能AI環境，並具備全球擴充套件所需的靈活性和效率。”

除了MI350P，AMD還在開發更高階的風冷GPU以及液冷型號。例如，Instinct UB B8是MI350X和MI355X系列的八GPU風冷配置，以通用基板形式交付，提供2.3TB HBM3和8TB/s記憶體頻寬，並支援AMD Infinity Fabric用於擴充套件，AMD稱其效能可與Nvidia Blackwell媲美。UB B8將支援引數高達5000億的模型，專為大規模AI訓練和推理設計。

AMD還提供液冷版Instinct MI355X，熱設計功耗高達1400W，超微和TensorWave正與AMD合作支援這些液冷晶片。此外，AMD也有液冷版Radeon遊戲GPU。

雖然市場上存在需要液冷甚至800V直流供電的超高階GPU，但許多客戶希望在現有基礎設施上執行稍小的AI模型，而不願建造全新的資料中心。AMD的MI355P系列正是瞄準這一細分市場。