Point-E技術最大特色在於無須大量數據進行訓練,僅需透過少量圖像、3D資料進行匹配,即可將文字內容「轉換」成圖像,進而將圖像形成3D模型,過程也僅需花費數十秒時間即可完成。
繼推出DALL-E文字轉圖像生成人工智慧技術,以及近期吸引多人使用的ChatGPT自然聊天人工智慧技術,OpenAI稍早又提出名為Point-E的人工智慧技術,標榜可透過簡單文字判斷,即可快速生成由點狀構成的3D模型。
雖然市場同樣也有類似的人工智慧技術被提出,但OpenAI強調Point-E背後僅需單一GPU,加上幾分鐘時間內即可生成3D模型,相較Google提出的DreamFusion需要搭配多組GPU,以及更長運算生成時間,Point-E顯然有更大競爭優勢。
由於目前越來越多內容都是以3D形式建模構成,另外再透過渲染、貼圖等方式加上更精緻外觀,因此如果能夠快速建構3D模型內容,對於遊戲、影像等內容創作將更為有利,加上目前多數業者推動的元宇宙、虛擬視覺等應用也都需要透過大量3D模型建構擬真互動環境,因此Point-E技術的誕生也將推動此類應用發展成長。
依照負責帶領OpenAI研究團隊的Alex Nichol說明,Point-E技術最大特色在於無須大量數據進行訓練,僅需透過少量圖像、3D資料進行匹配,即可將文字內容「轉換」成圖像,進而將圖像形成3D模型,過程也僅需花費數十秒時間即可完成。
而形成正確的3D模型背後關鍵,則是在於必須提供準確且足夠的描述內容,如此一來才能讓人工智慧透過文字判斷正確生成內容。
目前透過Point-E產生的3D模型解析度不算高,但是藉由後續「精修」之後產生圖像,顯然已經可以應用在不少內容創作。
暂无评论内容