NVIDIA 在 2022 年 9 月首度公開新一代代號 Hopper 的 NVIDIA H100 Tensor GPU 在 MLPerf 推論基準測試的效能,刷新當時的 MLPerf 效能紀錄;如今 NVDIA 再次公布 NVIDIA H100 在產業組織的人工智慧訓練最新測試成績,創下處理企業 AI 負載的新紀錄,大幅領先競爭對手產品,顯見 NVIDIA H100 是當前對建構與部署最先進 AI 並追求極致效能的用戶的最佳選擇;然而縱使是問世兩年的 NVDIA A100 ,借助持續的軟體升級, NVIDIA A100 Tensor GPU 仍打破去年所公布的成績。
▲即便 NVIDIA H100 具備突破性的效能,但兩年前的 NVIDIA A100 仍提供 AI 與 HPC 領域中流砥柱的效能
▲ H100 相較 A100 在 MLPerf 訓練高出 6.7 倍,而 A100 比起初登場則提升 2.5 倍效能
▲ NVIDIA H100 相較其它同質競品不僅效能突出,對各式框架亦有極佳的相容性
NVIDIA H100 在透過產業界以主流 AI 負載測試項目為基準的 MLPerf 測試的 8 項測試項創下訓練模型的世界紀錄,對比上一世代的 A100 GPU 高出 6.7 倍;但 A100 GPU 也藉助軟體提升,相較 2 年前初次進行測試提升達 2.5 倍效能。 H100 能夠具備出色機器學習訓練的關鍵不僅只是純運算效能的提升,其中 Transformer Engine 針對大型自然語言如 BERT 等地處理能夠發揮極大的效益。
▲ NVDIA A100 在傳統的 HPC 效能測試仍保持領先,同時對比兩年前的成果高出 9 倍
同時 NVIDIA 對於軟體的持續更新也使得既有硬體獲益,如 NVIDIA A100 在 CosmoFlow 測試訓練 AI 模型,對比兩年前第一輪的 MLPerf HPC 測試的結果高出 9 倍,在同樣的作業負載亦對比其他競品高出 66 倍;這也顯示即便是上一代的 NVIDIA A100 ,對於結合 AI 的天體物理學、天氣預測、分子動力學的工作訓練模型、藥物開發等領域有出色的成果。
▲借助架構延續性與開放軟體平台,使應用開發不僅能延續到廣泛的 NVDIA 硬體還能持續升效能
NVIDIA 強調,借助軟體平台的開放特性與 GPU 架構的延續性,對於內容開發者不僅能使開發成果在不同世代、不同效能層級的 NVDIA GPU 使用,同時借助軟體持續更新,效能也不斷獲得提升,且目前 NVIDIA GPU 也廣泛獲得全球主要資料中心、超級電腦系統與雲服務採納,並且相容各式主流的 AI 框架,並非只針對單一項目進行加速,對內容開發者是相當重要的誘因。
暂无评论内容