
日前推出可透過文字、靜態圖像生成長達1分鐘擬真影片的自動生成式人工智慧 技術「Sora 」之後,OpenAI 稍早再次宣布推出以15秒長度聲音 範本即可生成自然合成語音 的Voice Engine技術。
不過,為了避免產生爭議,OpenAI目前並未對外開放使用Voice Engine 技術,僅針對特定用途如協助因病逐漸喪失語言能力的病患保留其聲音,同時所有以此技術產生內容都會加上可追蹤來源的數位浮水印,避免有心人士濫用此技術。
而透過Voice Engine技術生成的合成語音,幾乎與本人發出聲音相仿,甚至也能讓合成語音轉以其他語言陳述,讓使用者能以自己聲音與國外對象溝通,而非透過其他合成語音對談。
類似技術,其實先前已經有不少業者提出,但通常需要長度更長的原始語音資料進行學習,因此OpenAI標榜僅需15秒長度即可完成學習訓練,並且生成貼近本人語音聲調內容,顯然是在做技術上的火力展示。
目前OpenAI僅先向特定企業提供此技術進行測試,並且透過反饋意見改善使用體驗與安全問題。包含線上教育公司Age of Learning、敘事視覺化平台HeyGen、健康資訊軟體商Dimagi、AI通訊App開發商Livox,以及健康系統商Lifespan都已經開始使用OpenAI此技術打造應用服務。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 影/iPhone 17 Pro Max實機曝光!機身比16 Pro厚 相機模組神巨大
📢Sony WH-1000XM6藍牙耳機開箱!摺疊回歸、降噪驚豔「讓世界變安靜」
📢 任天堂Switch 2台灣7月10日上市開賣!試玩台北體驗會就能買 價格出爐
📢 注意!華碩路由器全球逾9千台遭入侵「重開機沒用」 用戶快做1事自保
📢 YouTube會員台灣便宜雙人方案來了!價格比印度貴近4倍 規則一次看
📢 你是「居然人」或「竟然人」?LINE都市傳說瘋傳 網搜對話狂讚:真的準