Intel 實驗室近期在電機電子工程學會舉辦的電腦 視覺與圖像識別會議中,展示與Blockade Labs合作推出的擴散模型Latent Diffusion Model for 3D (LDM3D),標榜能以自動生成式人工智慧 技術,藉由文字描述快速產生能以360度視角觀看的3D影像。
相較目前多數自動生成式人工智慧技術多半僅能以文字敘述產生2D平面影像,Intel實驗室此次與Blockade Labs合作推出的擴散模型Latent Diffusion Model for 3D,則是能在使用相同參數情況下,配合文字描述自動產生影像與相應景深資訊,藉此快速形成3D立體影像,並且能用於快速建模、設置3D場景等需求,藉此加速諸如建築、設計,以及遊戲與娛樂相關產業應用。
此擴散模型是由包含超過4億個影像與文字標註的LAI ON-400M資料庫中,透過其中10000個樣本進行訓練,使用由Intel實驗室開發的Dense Prediction Transformer (DPT)大型深度估測模型,針對訓練語料庫進行標註。
同時,此擴散模型是在搭載Intel Xeon處理器與Habana Gaudi AI加速器的人工智慧超級電腦上進行訓練,同時藉由Dense Prediction Transformer大型深度估測模型將每個影像中的所有畫素提供高精準相對景深資訊,最後生成影像即可結合景深資訊形成能以360度視角檢視的3D內容,並且能在生成過程降低記憶體使用量,藉此減少運算延遲情況。
目前Intel已經將此擴散模型透過允許使用者共享機器學習模型及數據集的平台Hugging Face進行開源,藉此讓更多研究人員、業者能藉此打造各類應用項目,並且持續改善模型使用效率。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 WWDC 2026看這篇就懂!3分鐘掌握Apple最重要3大更新亮點
📢 WWDC 2026除了AI…iOS 27還有7大寶藏功能:鬧鐘音量終於獨立
📢iPhone Fold「最清楚」實機照曝光!蘋果摺疊機改護照式大小、剩1種顏色
📢 LINE免費貼圖7款!日文諧音哏「鼠咪嗎誰」必用 吉娃娃配GUCCI超迷因
📢小米空氣淨化器6開箱!過濾細菌、病毒、甲醛汙染源 過敏族殺菌高CP
📢 舊Apple Watch真的要丟了!Watch OS 27完整支援名單 連旗艦款都說掰掰

討論區