
推出Stable Diffusion影像生成工具的人工智慧 業者Stable AI ,近期宣布推出其新款語音 生成模型 Stable Audio 2.0,將能透過文字 產生時間長度達3分鐘的44.1kHz規格立體聲音 訊,相比先前版本僅能產生45秒明顯有大幅成長。
Stable Audio 2.0跟1.0版本一樣,都是透過AudioSparx收錄超過80萬組音訊資料進行訓練,除了可透過文字產生音訊內容,更可透過上傳參考音訊樣本,讓使用者 透過自然語言描述方式生成不同音訊內容,並且透過風格轉換工具進行後續調整。
而Stable Audio 2.0可產生音質達44.1kHz規格的立體聲音訊,同時長度更可長達3分鐘,幾乎是多數歌曲 常見長度,預期可讓更多創作者生成所需配樂、音訊內容。
目前Stable Audio 2.0已經對外免費開放使用,使用者能透過Stable AI或Google帳號登入後操作。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
📌 數位新聞這裡看!
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 比天峰藍更美!iPhone 17 Pro爆配合M4 MacBook Air推全新「天藍色」
📢Switch 2預購有雷!電商綁套餐把1熱門遊戲變「陷阱同捆包」 網:超無良
📢 他組裝14萬RTX5090電腦…三井3C「後台改訂單」加價1萬4!道歉文更傻眼
📢 日本開箱!Switch 2搶先開箱試玩 瑪利歐賽車世界全新生存戰、薩爾達畫質大躍進
📢 LINE免費貼圖5款!社畜必下載「我愛我的工作」哏圖 還有餃貓、外星人陪伴
📢 資費懶人包/4G吃到飽破5百元優惠縮水 5G還有399方案