GTC 2024:黃仁勳強調運算產業將自資料中心邁入以生成式AI引領的AI Factory,Blackwell賣的是系統與生態系而非晶片

NVIDIA執行長黃仁勳在GTC 2024大會第二日的媒體團訪時,強調資料中心將面對巨大的轉型,借助GPU加速的生成式AI,他認為下一代的資料中心應該稱為AI Factory(AI工廠),透過AI技術產出各式的資源,不僅只是單純產生數據;黃仁勳強調,遊戲玩家早就已經體驗過由GPU生成的遊戲圖像內容,然而這樣的內容生成將是下一代AI Factory的重點,透過AI Factory產生的Token,進而生成圖像、影音、文字等內容,由資料中心至AI Factory,將為產業帶來巨大的變革。

▲黃仁勳強調不同於資料中心產生數據,AI Factory藉由產出Token進而生成各式充滿創意與突破框架的圖像、影像與文字

自傳統資料中心至AI Factory,借助生成式AI,AI Factory產生的不僅只是純粹的數據,而是充滿各種可能性的生成內容;NVIIDA在GTC 2024公布的Blackwell架構,將使產業往AI Factory踏進一大步;Blackwell不僅比起Hopper更為強大,同時Blackwell也更為節能、高效,同樣訓練1.8T的AI模型,Blackwell僅需使用1/4的Hopper GPU,以1/4的能耗即可在相同的時間完成模型的訓練,同時透過支援FP4,推論的性能甚至可提升30倍。

▲黃仁勳強調Blackwell是一個系統而非晶片

此外,被問及Blackwell GPU的價格相較Hopper提升多少時,黃仁勳表示,NVIDIA並非販售Blackwell GPU,而是銷售Blackwell系統,搭配x86的B200 GPU系統架構與採用GB200 Superchip的系統的價格就截然不同,相較之下B200 GPU系統的NVLink迴路已經整合在系統內,成本相對較低,然而GB200 Superchip的NVLink迴路是由外部的NVSwitch交換器管理,同時一套DGX GB200由72個Blackwell GPU構成,成本自然高出單一系統僅有8 GPU的DGX B200。

▲DGX GB200內部由18台載有GB200 Superchip的機架伺服器,以外部的NVSwitch交換機連結

然而兩者的效益截然不同,DGX B200最多僅將8個GPU構成一個大型GPU,同時僅能使用GPU上的記憶體,然而基於GB200 NVL72的DGX GB200系統的NVLink連接高達72個GPU,同時還可共享Grace CPU的LPDDR5X記憶體,運算性能不僅更強大,同時記憶體總量也更高,有助於訓練與推論更大型的AI模型。

▲黃仁勳表示生成式AI使得每個人與各領域專家不必學習程式語言即可進行創作

黃仁勳提到,生成式AI最大的價值是開創更多的可能性,使各個領域的專家都能利用生成式AI創新,這些專家不再需要同時是程式語言專家,皆可利用自然語言與生成式AI互動,同時創造更多的可能性,且不僅只是在娛樂與藝術,也包括程式撰寫,半導體設計,能源探索、藥物研究等等,NVIDIA也宣布全新的NIM微服務,使生成式AI更易進行客製化;此次GTC大會更宣布與台積電、新思科技合作的GPU加速微影技術cuLitho將結合生成式AI,利用生成式AI不受刻板印象限制的特性,不僅使微影技術更快,同時也有助設計更具效益的圖形。

▲黃仁勳強調Blackwell不光只是Intel與台積電兩者的合作,還包括HBM記憶體供應商、封測等

另外黃仁勳也被問及關於與台積電深度合作、還有與其它晶圓代工業者的合作關係,黃仁勳提到如Blackwell雖然是NVIDIA與台積電共同努力的成果,然而也不僅只是NVIDIA與台積電兩者就能促成,還包括HBM記憶體供應商如海力士、美光、三星需將產品送達台積電進行CoWoS封裝,後續也還需由封測業者測試,才能完成一顆Blackwell,至於與其它業者的代工關係,黃仁勳強調此次Blackwell即是由台積電專屬的4nm製程生產,現階段Blackwell不會由其它晶圓代工業者生產,但也表示進入CoWoS封裝世代的晶片,不再僅有由單一晶圓廠一條龍生產晶粒的模式,由多個晶圓代工廠生產的晶粒也是有可能的(註:例如Intel當前已有多款晶片產品即是結合Intel與台積電的晶粒進行封裝)。

© 版权声明
THE END
喜歡就支持一下吧
点赞10 分享
評論 抢沙发
头像
歡迎您留下寶貴的見解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容