Stable AI推出可透過文字描述生成44.1kHz規格、長度達3分鐘立體音訊的Stable Audio 2.0

聯合新聞網 楊又肇

推出Stable Diffusion影像生成工具的人工智慧業者Stable AI,近期宣布推出其新款語音生成模型Stable Audio 2.0,將能透過文字產生時間長度達3分鐘的44.1kHz規格立體聲音訊,相比先前版本僅能產生45秒明顯有大幅成長。

Stable Audio 2.0跟1.0版本一樣,都是透過AudioSparx收錄超過80萬組音訊資料進行訓練,除了可透過文字產生音訊內容,更可透過上傳參考音訊樣本,讓使用者透過自然語言描述方式生成不同音訊內容,並且透過風格轉換工具進行後續調整。

而Stable Audio 2.0可產生音質達44.1kHz規格的立體聲音訊,同時長度更可長達3分鐘,幾乎是多數歌曲常見長度,預期可讓更多創作者生成所需配樂、音訊內容。

目前Stable Audio 2.0已經對外免費開放使用,使用者能透過Stable AI或Google帳號登入後操作。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

📌 數位新聞這裡看!

 訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 「找車位神器」3秒搜出停車格!5縣市可用 駕駛實測嘆:相見恨晚
📢網紅「小周牙醫」歧視同志言論挨轟!道歉被網抓包IG、YT秒做1事:沒誠意
📢 Switch 2台北體驗會7/5登場!抽選制、超詳細報名規則曝
📢 ASUS VivoWatch 6 AERO智慧手環開箱!指尖量心電圖 睡眠追蹤曝「9成全淺眠」
📢 YouTube會員台灣便宜雙人方案來了!價格比印度貴近4倍 規則一次看
📢 獨/等到iPhone嗶進站!蘋果iOS18.4開放台灣NFC交易 悠遊卡公司回應了

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者,目前為自由寫手與Mas...

人工智慧 AI 使用者 Stable AI 聲音 文字 模型 語音 歌曲 免費

推薦文章

留言