對于下一代顯卡,AMD、NVIDIA在臺北電腦展期間都三緘其口,絲毫沒有提及。AMD只講處理器,NVIDIA則只說數據中心GPU、CPU。
NVIDIA宣布,Ampere架構的計算卡A100、桌面超算HGX A100,Hopper架構的計算卡H100、桌面超算HGX H100,將在該系列中首次引入液冷散熱,從而提高散熱效率、降低能耗、節省空間和成本。
NVIDIA表示,它們都采用了直接芯片(Direct-to-Chip)冷卻技術。
HGX A100、HGX H100系統采用的都是SXM樣式計算卡,在機架內直接整合液冷散熱系統,取代傳統的系統風冷散熱,體積更加緊湊,前者現已出貨,后者今年第四季度。
A100 PCIe(80GB)、H100 PCIe獨立計算卡則有些類似桌面液冷顯卡,整合水冷頭,不過接口放置在尾部,以便對接液冷系統,前者今年第三季度出貨,后者明年初。
數據中心服務商Equinix正在實驗室中測試自己的首款液冷GPU方案,結果發現,采用液冷技術的數據中心工作負載可與風冷設施持平,同時消耗的能源減少了約30%。
同時,液冷版的A100/H100 PCIe只需占用一個插槽位,相比傳統兩個插槽位的風冷版,可以節省最多66%的機架空間。
NVIDIA估計,液冷數據中心的PUE(電源使用效率)可能達到1.15,遠低于風冷的PUE 1.6。
NVIDIA GH100核心采用臺積電4nm工藝制造、CoWoS 2.5D晶圓級封裝,集成800億個晶體管、18432個CUDA核心、576個Tensor核心、60MB二級緩存,可搭配6144-bit HBM2e/HBM3高帶寬內存。
H100計算卡支持SXM、PCIe 5.0兩種形態,其中后者功耗高達史無前例的700W,相比A100多了整整300W。
SXM5版本只開啟15872個CUDA核心、528個Tensor核心、50MB二級緩存。
PCIe 5.0版本則只有14952個CUDA核心、456個Tensor核心。(作者:上方文Q)
關鍵詞: NVIDIA計算卡第一次上液冷 提高散熱效率 降低能耗 數據中心服務商