Meta基礎建設全面改造,包括Meta首款客製化AI晶片,新的AI最佳化資料中心設計,以及配備1萬6000組GPU的超級電腦。
Meta宣布將重新改造新一代基礎建設架構,其中涵蓋硬體及軟體堆疊層面,藉此強化人工智慧技術發展,並且能更有效率地佈署各項新技術,進而透過人工智慧驅動未來元宇宙應用發展。
在新一代針對人工智慧設計的基礎設施架構中,將包含Meta第一個用於執行人工智慧模型的客製化晶片,以及全新人工智慧運作最佳化資料中心設計,並且配備1萬6000組GPU進行加速運算的超級電腦。
同時,Meta更強調人工智慧是其產品核心,不僅提升個人化體驗程度、開發更安全且公正的產品,並且創造更豐富的體驗,更能協助企業商家接觸到最重視的受眾。
接下來,Meta更計畫調整程式編寫的方式,透過內部開發的生成式人工智慧程式編寫輔助工具──Code Compose,藉此提高開發人員在軟體開發生命週期的工作效率。
從2010年設立第一個資料中心之後,Meta更從2015年的Big Sur硬體,到PyTorch程式語言開發,再到去年針對人工智慧研究設計的超級電腦,目前將以三大方式精進基礎建設架構:
• MTIA (Meta Training and Inference Accelerator): MTIA是Meta第一個由內部開發的客製化加速器晶片系列,專門用於處理推理相關的工作。MTIA針對內部的工作內容設計,其提供運算效能及處理效率優於CPU。藉由同時部署MTIA晶片與GPU,將能提高每項工作的績效、減少延遲,並且提升處理效率。
• 新一代資料中心:Meta的新一代資料中心設計除了支援現有產品外,更將協助未來新的人工智慧硬體展開訓練及推理。這個新資料中心將為人工智慧最佳化所設計,支援液體冷卻式人工智慧硬體設備 (liquid-cooled AI hardware) 及高效人工智慧網路,將數千個人工智慧晶片串聯在一起,形成資料中心規模的人工智慧訓練集 (AI training clusters)。
無論其開發的時間與成本都將提升,還能與其他新的硬體設備相輔相成,像是 Meta 為了支援持續成長的影音內容而首度在內部開發的 ASIC 解決方案──MSVP (Meta Scalable Video Processor)。
• Research SuperCluster (RSC)人工智慧超級電腦:Meta的RSC是全世界最快的人工智慧超級電腦之一,可訓練新一代的大型人工智慧模型支援新的擴增實境 (AR)工具、內容理解 (Content Understanding)系統、即時翻譯技術等,配備1萬6000個GPU,全數皆可透過3層Clos網路結構存取,為2000個訓練系統各自提供足夠資源。
從去年開始,RSC已經開始參與各項研究計畫,例如Meta推動、在今年初公佈的大型語言模型LLaMA (Large Language Model Meta AI)。
另外,特別量身打造設計的基礎建設架構,將讓Meta在實體層面、虛擬層面、軟體層面,以及對應用戶實際使用的端對端體驗全面提升。目前Meta從資料中心到伺服器設備,乃至於維持所有運行的機械繫統,均由自行設計、開發及運行,不僅從頂端到底層掌握整個架構,更根據Meta實際需求設計。
而Meta預期未來大量自製基礎建設架構將顯得更加重要,並且預期未來10年將會看見更多客製化晶片設計,以及針對特定領域打造的人工智慧計處建設架構,以及針對大規模佈署需求設計的新系統與工具,將使Meta藉由最新研究成果開發更複雜的人工智慧模型。
暂无评论内容