NVIDIA公布多篇將在SIGGRAPH展示研究 以AI改變傳統影像工作流程

聯合新聞網 楊又肇

在今年度的SIGGRAPH電腦繪圖大會展開之前,NVIDIA表示將公布20篇關於以人工智慧應用繪圖的研究論文,其中包含能以人工智慧技術讓開發者、藝術創作者的構思想法變成2D、3D,或是對應超現實主義、奇幻風格的影像,甚至也能使其變成更真實的動態影片內容。

NVIDIA這些研究論文是與美國、歐洲及以色列多所大學合作,並且以自動生成式人工智慧與神經圖像運算技術構成,這些論文包含將文字轉換為具個性化圖像的生成式人工智慧模型,以及將靜止圖像轉換為3D物件的逆向渲染工具,或是使用人工智慧技術,以驚人真實感模擬複雜3D元素的神經物理模型,並且包含可解鎖即時生成、人工智慧技術產生視覺細節的神經渲染模型。

今年預計在SIGGRAPH上電腦繪圖大會展示的研究進展,將幫助開發人員和企業快速生成合成資料,藉此填充用於機器人和自動駕駛車輛培訓的虛擬世界,甚至可以讓藝術、建築、平面設計、遊戲開發和電影創作人更快地製作出用於分鏡、預視和甚至影片製作的高品質視覺效果。

具有個人風格的人工智慧:客製化文字到圖像模型

將文字轉換為圖像的生成式人工智慧模型是創造概念藝術和對於電影、遊戲和3D虛擬世界製作分鏡表的強大工具。將文字生成圖像的人工智慧工具,可以將像是「兒童玩具」之類的提示變成絨毛動物玩具、積木或拼圖的圖像,藉此讓創作者可以從中獲得靈感。

例如,某玩具品牌創意總監可能藉由新款泰迪熊策劃一項廣告活動,並且希望在不同情況下形象化該玩具,例如泰迪熊茶會。為了在生成式人工智慧模型的輸出中實現這種級別的特異性,特拉維夫大學和NVIDIA的研究人員撰寫了兩篇SIGGRAPH研究論文,讓使用者能夠提供讓模型可以快速學習的圖像範例。

第二篇論文則介紹一款名為「Perfusion」的高度緊湊模型,採用少量概念圖像,讓用戶可將多個個性化元素 (例如特定的泰迪熊和茶壺)組合成一個人工智慧生成的視覺效果:

提供3D世界內的服務:逆向渲染和角色創建的進展

一旦創作者構思出虛擬世界的概念藝術,下一步就是渲染環境並使用3D物體和角色進行填充。NVIDIA Research藉由人工智慧技術,藉此縮減將2D圖像和影像轉換為3D的耗時過程,讓創作者可以將其導入繪圖應用程式進一步編輯。

與加州大學聖地亞哥分校的研究人員共同創作的第三篇論文,其中可透過單張2D肖像生成和渲染出逼真的3D頭肩模型,藉此讓3D頭像創建與3D視訊會議變得更加容易,並且能在一般電腦桌面上執行,透過傳統網路攝影機或智慧手機攝影功能,即可生成逼真的或風格化的3D遙現 (Telepresence)遠端臨場。

第四個專案則是與史丹佛大學合作,為3D角色帶來逼真的動作。研究人員建立了一個人工智慧系統,該系統能夠從真正的網球比賽的2D影片記錄中學習一系列網球技巧,並且將動作應用於3D角色,而模擬的網球選手角色可精確地將球打到虛擬球場上的目標位置,甚至可以與其他角色進行長時間的回合比賽。

除了網球的測試案例外,這篇SIGGRAPH文章還探討了如何在不使用昂貴的運動捕捉資料的情況下,創造出具有多種技能、並能進行真實運動的3D角色。

不失一根頭髮:神經物理學實現逼真的模擬

當3D角色生成後,藝術家可以添加像是頭髮這樣逼真的細節,這對動畫師來說是一個複雜且需要大量運算的挑戰。

人類平均有10萬根頭髮,每一根都會隨著個人動作和周圍環境而動態變化。傳統上,創作者使用物理公式來計算頭髮的運動,根據可用資源來簡化或近似頭髮的運動,這就是為什麼大製作電影中的虛擬角色擁有比即時遊戲角色有更豐富頭髮細節。

第五篇論文則展示一種使用神經物理學的方法,可以高解析度模擬數萬根頭髮。神經物理學是一種人工智慧技術,它教導神經網路預測物體在現實世界中的運動方式。

該團隊為實現完整規模頭髮的準確模擬提出了一種新穎的方法,專門針對現代GPU進行優化。與最先進基於CPU的解算器相比,它提供了顯著的效能提升,將模擬時間從多天減少到僅需幾小時,同時提高了即時的頭髮模擬品質。這種技術終於實現了物理精確與互動的頭髮造型。

神經渲染為實時繪圖帶來電影品質的細節

當一個虛擬環境被填充了動畫3D物體和角色後,實時渲染會模擬光線通過虛擬場景反射的物理過程。NVIDIA最近的研究顯示,紋理、材料和體積的人工智慧模型可以在即時渲染中提供電影等級的逼真視覺效果,並且能用於遊戲和數位雙生。

NVIDIA二十年前就發明了可程式化的著色技術,使開發人員可以自定義繪圖管道。在這些最新的神經渲染發明中,研究人員透過運行在NVIDIA實時繪圖管道內的AI模型來擴展可程式化著色代碼。

在第六篇SIGGRAPH論文中,NVIDIA將呈現神經紋理壓縮,在不佔用額外GPU記憶體的情況下,提供高達16倍的紋理細節。神經紋理壓縮可以大幅提升3D場景的真實感,如下圖所示,這說明神經壓縮紋理 (右)如何捕捉比先前格式更清晰的細節,在先前格式中文本保持模糊 (居中)。

第七篇論文介紹的是NeuralVDB,這是一種人工智慧驅動的資料壓縮技術,可使表示煙、火、雲和水等體積資料所需的記憶體減少100倍。

NVIDIA還公布關於更多神經材料細節的研究,這些細節在最新的NVIDIA GTC主題演講中已經展示。該研究描述了一個人工智慧系統,學習光如何從真實的多層材料反射,將這些資產的複雜性降低到實時運行的小型神經網路,使陰影處理速度提高10倍。

從這個神經網路渲染的茶壺中可以看出其逼真度,它準確地呈現了陶瓷、不完美的清釉、指紋、污跡甚至灰塵。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者,目前為自由寫手與Mas...

人工智慧 AI 動畫 NVIDIA

推薦文章

留言