高通專文介紹NPU之於裝置端執行生成式AI的意義,並強調透過異構運算能最大限度提升效能、能源效率

雖然行動裝置結合AI技術已經不是新聞,然而隨著生成式AI引領新一代AI技術,使AI不再只是作為單純的辨識與增強,而是能夠與使用者深度互動的技術,裝置端AI技術也邁入全新的局面,同時處理器產業也不約而同的標榜在架構中導入NPU,只不過若僅熟悉傳統PC領域的用戶,恐怕對於NPU會比較陌生,在新一代平台Snapdragon 8 Gen 3與下一代PC平台Snapdragon X Elite加入增強NPU設計的高通,就專為NPU在裝置端生成式AI的意義與NPU結合生成式AI如何增強使用體驗撰寫一則專文。

高通開宗明義的表示,NPU是作為高通異構運算的一環,並專為生成式AI應用而生,也是結合CPU、GPU進行異構運算後,能夠最大限度提高應用程式效能、改善發熱與延長電池壽命,並進一步實現全新的生成式AI使用體驗。

生成式AI與傳統運算不同,NPU則是因應生成式AI而生的架構

▲NPU是作為異構運算的一環,專為AI應用而生

高通強調,由於AI的運算方式與傳統運算不同,故需要更高效率的處理器架構,而NPU即是因應AI而生的架構,並與針對傳統運算的CPU、GPU相輔相成;CPU旨在作為順序演算與即時性運算,GPU能夠進行串流平行資料處理,NPU則是具備AI運算所需的純量(Scalar)、向量(Vector)、張量(Tensor)運算能力,進一步分類,CPU在AI適合應用在低延遲的小型AI模型運算、GPU則是影像領域相關運算,NPU對於大型語言模型、大型視覺模型運算有絕佳的效果。

▲隨著AI演進至生成式AI,NPU的運算量也越來越吃重

雖然AI運算仍可透過CPU與GPU進行異構運算,但效能轉換效率不佳,故需要導入專為AI相關領域提供加速設計的NPU,使執行AI應用能夠以低能耗、高速度進行,而具備正確且合宜架構的NPU能夠進一步減少CPU與GPU於AI應用的涉入,透過NPU以更具效率的方式執行AI應用。隨著基於大型語言模型、大型影像模型的生成式AI出現,裝置端的NPU架構也日趨複雜,後續更將自單一應用發展至混合多模型運算,NPU的架構複雜性與效能也隨之增長。

承襲高通AI Engine積累的AI技術

▲高通透過多年AIE發展,提供對業界廣泛AI的技術支援與跨領域開發環境

高通在許久之前就於Snapdragon平台提出AI Engine(AIE)的概念,同時也在近期的Snapdragon平台導入Hexagon NPU,但更重要的是AIE還整合包括Hexagon NPU、Adreno GPU、Kryo/Oryon CPU、Sensing Hub、記憶體子系統,使這些架構都能彼此進行異構協作。

同時,高通也針對開發者提供具平台一致性的Qualcomm AI Stack工具,使開發者能夠透過簡便的工具開發用於各領域Snapdragon平台的AI技術,且不僅止於手機與PC,也能擴大到包括嵌入式、機器人與智慧汽車。

© 版权声明
THE END
喜歡就支持一下吧
点赞10 分享
評論 抢沙发
头像
歡迎您留下寶貴的見解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容