You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

輝達演算法 文字生成立體模型

By on November 23, 2022

原文刊於信報財經新聞「StartupBeat創科鬥室

人工智能(AI)技術一日千里,不單畫家擔心被AI取代,3D建模師亦恐怕飯碗不保。輝達(Nvidia)研究團隊推出Magic3D演算法,用家只需輸入文字,系統便能在40分鐘內生成高分辨率3D模型,用於後續動畫渲染。

Magic3D僅需40分鐘 快NeRF逾倍

Magic3D師承Google於大約兩個月前推出的「文本生成3D模型」(Text-to-3D)演算法DreamFusion,惟在分辨率、計算時間更勝一籌。論文介紹,DreamFusion以神經輻射場(NeRF,深度學習演算法之一)3D生成技術為核心,輔以已訓練的「文本生成圖像」(Text-to-2D)演算法Imagen及新研發的圖像採樣法,能基於文字生成可多重照明的3D模型。

用戶只需輸入文字,便能在40分鐘內,以Magic3D生成高分辨率3D模型。(影片截圖)

不過,NeRF始終有其局限性。輝達團隊在論文表示,NeRF佔用過多記憶體,無法提升分辨率,且優化時間太長。在第四代TPU(張量處理器)晶片上,NeRF平均需1.5小時生成一個64乘64分辨率模型。Magic3D卻能在40分鐘內,生成高達512乘512分辨率的3D模型,運算速度快一倍以上。團隊指出,逾六成用戶偏好Magic3D多於DreamFusion。

推動大眾參與內容創作

Magic3D影片介紹,演算法分為兩階段,首先採用低分辨率算法獲得粗糙建模,再以高分辨率算法加持的渲染器優化模型,生成作品能用於圖像渲染引擎,例如自家元宇宙開發平台Omniverse。

Magic3D生成的作品能用於圖像渲染引擎,例如輝達自家的元宇宙開發平台Omniverse。(Magic3D官網圖片)

輝達團隊稱,3D模型在網上難以獲取,探索文字生成3D模型乃自然之舉。今年9月,輝達加拿大研究團隊曾推出同類演算法Get3D,但需要大量3D模型作預先算法優化。團隊期望藉演算法,推動大眾參與3D合成技術,令每個人的創意都能融入3D內容創作。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們