去年11月,AMD發布了CDNA2新架構的新一代加速計算卡Instinct MI250X、MI250,升級6nm工藝、2.5D MCM雙芯整合封裝、第三代Infinity Fabric總線互連技術,集成最多14080個流處理器核心、880個矩陣核心、218GB HBM2e顯存/內存。
兩款卡均采用OAM模塊形態,現在終于增加了PCIe標準形態,型號“Instinct MI200”,支持PCIe 4.0。
MI200回歸單芯封裝,規格、性能幾乎完全就是MI250砍去一半:291億個晶體管,104組計算單元,6656個流處理器核心,416個矩陣核心,4096-bit 64GB HBM2e顯存,三條Infinity Link互連總線(最多四塊并行)。
核心頻率還是1.7GHz,性能也正好減半,FP64/FP32矢量算力22.6TFlops,FP64/FP32矩陣算力45.3TFlops,FP16矩陣算力181TFlops,INT8矩陣算力181Tops。
顯存頻率也維持在3.2GHz,所以帶寬減半1.6TB/s。
整卡功耗從560W降到了300W,采用單個EPS12V 8針輔助供電接口,被動散熱。
軟件API支持OpenMP、OpenCL、HIP,計算框架支持TensorFlow、PyTorch、Kokkos、RAJA。(作者:上方文Q)
關鍵詞: AMD發布6nmMI210計算卡 處理器核心 加速計算卡 總線互連技術