NVIDIA 宣布推出一款實驗性自動生成式人工智慧 模型「Fugatto」,正式名稱為「Foundational Generative Audio Transformer Opus 1」,主要用於建立音訊內容,或是修改既有音樂、語音或聲音 細節,並且標榜能處理多種語言及口音內容。
此款模型被形容為「聲音萬用刀」,主要透過人工智慧理解內容,並且處理聲音細節,例如快速藉由人工智慧方式快速建立歌曲創作雛形,並且衍生創作不同風格、演奏方式及配音內容等。
而使用者能透過自訂聲音作為生成內容的訓練素材,而遊戲開發者也能利用既有聲音素材創造更多應用資源,或是因應玩家不同選擇需求調整遊戲中的聲音呈現效果。另外,此模型也能產生因時間變化的聲音,例如暴風穿過陸地時的風力撞擊聲,同時也能針對特定聲音進行訓練。
目前暫時還無法確認NVIDIA是否計畫對外開放此模型,有可能仍會以學術研究性質開放特定領域使用。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》