Meta宣布推出以人工智慧提高壓縮比例的聲音技術,讓更多聲音檔案內容可以在低頻寬網路環境下順利傳輸,並且不影響其還原播放音質表現,同時也能避免在傳輸過程發生斷斷續續或聲音不清楚情況。
此項由FAIR (Fundamental AI Research)基礎人工智慧研究部門所展示的音訊壓縮技術,透過名為EnCodec的訓練模型,透過人工智慧技術將音訊檔案壓縮至指定比例。
其中,將透過編碼器將原始音訊資料轉換成較低播放率,並且透過量化器將資料進一步壓縮至指定大小,並且可透過解碼器還原播放。過程中會透過人工智慧方式識別更細微的音訊資料差異,並且藉由深度學習生成樣本作為音訊檔案解碼還原依據,進而可在播放時呈現極度貼近原始音質的聲音內容。
相較市場先前已經有不少類似技術應用打造的音訊檔案壓縮技術,Meta強調其技術可用於還原等同CD音質的48kHz立體聲音訊檔案,並且能在單核心架構CPU上進行即時編碼與解碼,意味將能在多數裝置上使用,而其壓縮後的音訊所需傳輸頻寬僅為6Kbps,相比MP3檔案至少需要64Kbps的情況,約能減少10倍以上檔案大小。
雖然此項技術目前僅對應聲音檔案,但Meta強調未來將會納入影像內容壓縮,藉此加快網路內容傳輸速率,甚至推動元宇宙應用發展。
目前Meta已經將此項技術程式編碼與樣本透過GitHub公開,並且公布相關技術白皮書。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
📌 數位新聞這裡看!
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 嚇慘!LINE相簿驚見「陌生人大眼鬼影照」 官方認了曝3步驟解決
📢 LINE免費貼圖7款來了!可愛動物亂鬥 馬來貘、小薩、狗幾、喔熊慶耶誕
📢 LINE內建表情貼不見了?官方大改版網嚇「變好色又變醜」 1方法恢復舊版本
📢 【開箱】ROG Phone 9 Pro Edition!LED炫砲又低調「I人不害羞」
📢 出門玩不怕迷路!教你用Google Maps看「實景」找路 每次用每次成功
📢 CASETiFY胡子碰碰手機殼2款可愛開箱!台式早餐圖案聞香 磁吸卡套支架極速感應