18+

Google研究團隊提出可聆聽理解語音內容的AudioPaLM模型 還能自動生成口說內容

Google 研究團隊近期提出一項名為AudioPaLM的大型自然語言模型,將能實現語音內容聆聽理解,並且自動生成口說內容。

AudioPaLM的背後是由PaLM 2與AudioLM兩種模型組合,並且對應多模運作框架,使其能聆聽、理解語言內容,並且藉由自動生成式人工智慧 產生口說內容。

除了識別語音內容,並且進行自然互動之外,AudioPaLM更可對應多種語言翻譯功能,因此預期未來將能直接聆聽特定口語內容,隨即轉換成另一種語言呈現或許將能帶動更多跨語言溝通的便利性。

不過,目前此項技術仍處於研究階段,Google方面並未透露是否會將此技術應用在旗下諸如Google翻譯等服務,或是作為其他產品、服務應用。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

延伸閱讀

不是改密碼就不怕手機被駭!專家認證養成1行為 駭客凍未條難入侵

影/蘋果iPhone 15 Pro Max保護殼外流!真的有「新開孔」曝光超好用功能

女孩充電玩iPhone 13慘遭電擊「腳趾燒到焦黑」恐截肢 蘋果客服1理由說不賠

舊iPhone升iOS 16.5.1改善耗電?2款續航「起死回生」、新款直接少40分鐘

本日熱門 本周最熱 本月最熱