NVIDIA曾在2018年SIGGRAPH大會率先公布新一代消費級與繪圖卡架構Turing,故外界傳聞NVIDIA有可能尋當年模式在2024年7月底的SIGGRAPH 2024先行公布下一代繪圖卡與GeForce RTX 50消費級顯示卡採用的架構,不過根據NVIDIA公布的資訊,雖然NVIDIA執行長黃仁勳將在SIGGRAPH舉辦主題演講,但內容將會聚焦在渲染、模擬與生成式AI於圖形產業的應用,以及介紹NVIDIA Research的最新研究成果與論文,故下一代架構不會是此次活動的重點。
NVIDIA執行長黃仁勳將與WIRED資深主筆Lauren Goode就機器人與AI對工業數位化影響進行爐邊對談;同時作為OpenUSD主要倡議會員的NVIDIA也將在SIGGRAPH舉辦USD D吱吱NVIDIA,展示開發人員、產業領導者如何採用與發展OpenUSD建立AI驅動的3D管道。
NVIDIA Research預計在SIGGRAPH 2024公布超過20篇以上的論文,介紹推動合成資料產生器與逆向渲染工具的創新,這些成果能夠協助訓練下一代模型;同時這些論文與包括美國、加拿大、中國、以色列等多所大學以及來自Adobe與Roblox等公司的共同合作研究,聚焦在視覺生成式AI的擴散模型、基於物理的模擬與透過AI驅動的仿真渲染,其中兩篇內容更獲得技術最佳論文獎。
藉由擴散模型改善紋理繪製、文字到圖像生成
▲ConsiStory能夠以同一主題性產生連續圖像,並將原本需13分鐘的時間縮減為30秒
擴散模型是屬於文字提示轉圖像的工具技術,NVIDIA將在SIGGRAPH 2024公布兩篇相關的技術論文;其一是由NVIDIA與特拉維夫大學研究人員共同合作的ConsiStory,這項技術能夠將產生的多張圖片具有主題的一致性,可更容易產生如漫畫插圖或分鏡圖等連續敘事的圖像產生;研究人員透過名為了一種名為subject-driven shared attention(主題驅動共享注意力)的技術,將生成一致圖像所需要的時間自13分鐘縮減為30秒。
此外NVIDIA研究人員在SIGGRAPH 2023曾於Real-Time Level!活動已文字或圖像提示轉換為客製化紋理素材的AI模型獲得最佳展示獎,團隊將在SIGGRAPH 2024公布一篇2D生成式擴散模型應用於3D網格的互動紋理繪製,將能協助藝術家透過任何參考圖像即時繪製複雜紋理。
使基於真實世界物理的模擬持續發展
▲SuperPADL能在消費級GPU即時執行,並重現達5,000種技能動作
隨著運算性能、演算法、AI模型等技術的發展,現在的物理模擬技術越來越接近真實世界的效果,NVIDIA Research研究人員將在公布多篇相關論文,其中包括一篇旨在解決基於文字提示模擬複雜人類動作的SuperPADL;SuperPADL框架透過強化學習與監督學習,可在消費級GPU即時重現多達5,000多種技能的動作。
另一篇論文則是展示一種神經物理方式,應用AI學習物體在環境中移動的行為,並可應用於3D網格、NeRF或文本產生的3D模型所表示的實體物體;另外NVIDIA研究人員與卡內基美隆大學研究人員所合作撰寫的論文展示一項全新的渲染器,該渲染器不僅能夠模擬物理光,還可進行熱分析、靜電學與流體力學,由於容易平行化且不須繁瑣的模型清理,榮獲SIGGRAPH的五篇最佳論文之一,同時也展示一段透過此渲染技術進行好奇號火星探測車的熱分析的演示。
提升渲染真實感、繞射模擬的標準
▲透過光線繞射模擬技術模擬城市中的手機訊號覆蓋情況
NVIDIA的一篇論文將介紹能使可見光建模速度提升26倍、模擬繞射效果速度提高1,000倍的技術,並能活用在自駕車雷達的繞射效果;另外NVIDIA與滑鐵盧大學的研究人員共同發表一篇探討自由空間繞射的論文,聚焦光在物體邊緣擴散或彎曲的光學現象模擬,透過與路徑追蹤工作流程整合,可提升複雜場景中模擬繞射的效率,並提高1,000倍效率,除了可見光以外還可模擬雷達、聲波或較長的無線電波波長。
▲Blender Studio提供與先前採樣的視覺品質比較,左起為原先版本、中為提升25倍樣本的結果、右為參考影像
另外針對路徑追蹤Path Tracing領域,NVIDIA研究團隊公布兩篇相關論文改善NVIDIA於SIGGRAPH 2020所公布的ReSTIR路徑追蹤演算法的品質,ReSTIR是NVIDIA與達特茅斯學院研究人員共同公布的路徑追蹤演算法,當前廣泛應用於遊戲的光線路徑追蹤與圖像的即時渲染。其中與猶他大學合作的論文分享一種重複利用計算路徑的新方式,使有效樣本增加25倍,進而實現更好的圖像品質,另外還有一種方式是透過隨機轉變光線路徑的子集提高樣本品質,使去噪演算法提升效率,並減少最終渲染的視覺偽影。
教導AI透過3D方式進行思考
NVIDIA研究人員將在SIGGRAPH展示用於3D表現與設計的多用途AI工具,其中一篇論文介紹針對3D深度學習的GPU最佳化框架fVDB,fVDB足以達到與現實世界相同的規模,可為城市規劃3D模型、NeRF大空間規模與高解析度、大規模點雲的分割與重建提供AI基礎設施;另外與達特茅斯學院合作的表示3D物體如何與光互動的論文,介紹將多種外觀統一到單一模型的理論,獲得最佳技術論文的殊榮;另外NVIDIA研究人員攜手東京大學、多倫多大學與Adobe Research合作推出一種演算法,將過去需要數小時的3D網格上即時產生平滑空間填充曲線縮短至數秒,使使用者可高度控制產出結果並實現互動設計。
暂无评论内容