AMD推出用於AI推理的PCIe GPU卡
AMD釋出新款Instinct MI350P GPU,採用PCIe Gen 5介面,旨在讓企業無需重建資料中心即可升級AI推理能力。該卡擁有1850億電晶體、144GB HBM3e記憶體和600W熱設計功耗,支援多達八卡配置和模型分割槽,並得到戴爾、技嘉等廠商支援。
AMD上週釋出了其Instinct系列最新GPU——MI350P,該產品旨在讓企業無需重建資料中心即可快速提升AI推理能力。MI350P採用標準PCIe Gen 5介面,可直接插入現有伺服器的PCI匯流排,提供128GB/s的主機連線頻寬。
MI350P擁有1850億個電晶體、144GB HBM3e記憶體和4TB/s的峰值記憶體頻寬,執行在600W熱設計功耗內。它支援BF16、FP8、MXFP6和MXFP4精度,透過128個AMD CDNA第四代計算單元,在MXFP4精度下可提供高達4600峰值teraflops的效能。該GPU專為執行小型、中型和大型語言模型進行AI推理和檢索增強生成(RAG)場景設計,可處理引數規模達2000億至2500億的AI模型,並支援影片和JPEG解碼。
每個節點最多可配置八塊MI350P GPU,且每塊GPU可劃分為四個分割槽,每個分割槽擁有36GB HBM3記憶體。AMD強調,該GPU採用標準風冷散熱,無需液體冷卻。AMD計算與企業AI業務開發主管Suresh Andani在部落格中表示:“採用AI並不意味著從頭重建基礎設施。透過AMD Instinct MI350P PCIe卡,企業可以在現有資料中心內執行更多模型併為更多使用者提供服務。”
MI350P獲得了戴爾、技嘉等OEM廠商的支援。戴爾產品管理副總裁David Schmidt表示,新GPU將幫助客戶更快推進AI計劃:“對於認真對待AI的企業來說,本地基礎設施不是妥協,而是競爭優勢,它能提供控制力、安全性和可預測的結果。”技嘉總經理Daniel Hou也稱讚該GPU的實用性:“PCIe設計使MI350P能夠靈活部署並無縫整合到系統中,讓企業能夠構建高效能AI環境,並具備全球擴充套件所需的靈活性和效率。”
除了MI350P,AMD還在開發更高階的風冷GPU以及液冷型號。例如,Instinct UB B8是MI350X和MI355X系列的八GPU風冷配置,以通用基板形式交付,提供2.3TB HBM3和8TB/s記憶體頻寬,並支援AMD Infinity Fabric用於擴充套件,AMD稱其效能可與Nvidia Blackwell媲美。UB B8將支援引數高達5000億的模型,專為大規模AI訓練和推理設計。
AMD還提供液冷版Instinct MI355X,熱設計功耗高達1400W,超微和TensorWave正與AMD合作支援這些液冷晶片。此外,AMD也有液冷版Radeon遊戲GPU。
雖然市場上存在需要液冷甚至800V直流供電的超高階GPU,但許多客戶希望在現有基礎設施上執行稍小的AI模型,而不願建造全新的資料中心。AMD的MI355P系列正是瞄準這一細分市場。