美國國家能源研究科學運算中心 NERSC 為美國能源局開放科學主要機構,並 2021 年宣布導入全球最高效能的 AI HPC 系統 Perlmutter ,該套系統旨在探索科學研究,搭載 6,000 個 NVIDIA A100 GPU ,可實現 4 exaflops 的混合精度 AI 算力; NERSC 近期透過 Permutter 系統比較純 CPU 節點與透過 GPU 節點的加速運算在四項主要高效能運算與 AI 應用程式的執行結果,透過 NVIDIA A100 加速時,能源效率平均提高 5 倍、同時天氣預報應用程式性能提升 9.8 倍,意味著在一套具備 4 張 A100 的伺服器, NERSC 實現等同雙插槽 x86 伺服器 12 倍的性能。
▲ NERSC 透過實際執行應用程式進行效能比較,加速運算更具能源效益
以其效能與能源效率估測,在相同的性能水準為目的, GPU 加速系統每個月能使用比純 CPU 系統達 588 兆瓦的能源消耗,以美國電費計算,在一個 4 路 A100 雲端執行個體執行相同的工作負載一個月,相對純 CPU 執行個體可省下 400 萬美金以上的電費。不同於模擬推演的合成數具, NERSC 透過實際現實應用程式進行量測證實 Perlmutter 的加速運算架構無論在效能與能源效率皆有顯著的意義。
NERSC 的測試應用涵蓋分子動力學、材料科學與天氣預測等領域;其中 MILC 是做為模擬原子中使粒子保持在一起的基本力量,作為發展量子運算、研究暗物質與探索宇宙起源之用;而 BerkeleyGW 則是作為模擬與預測材料與奈米結構光學性質,能應用在更高效率的電池與電子設備。 EXAALT 則是解決分子動力學的基本挑戰,可模擬原子運動的短片而非僅有快照序列,搭配 NVIDIA A100 進行加速時提昇達 8.5 倍效能;用於氣候數據檢測颶風與大氣河流的 DeepCAM ,以 A100 GPU 加速時大舉提升達 9.8 倍的能源效率。
暂无评论内容