Google研究團隊提出可聆聽理解語音內容的AudioPaLM模型 還能自動生成口說內容
Google研究團隊近期提出一項名為AudioPaLM的大型自然語言模型,將能實現語音內容聆聽理解,並且自動生成口說內容。
AudioPaLM的背後是由PaLM 2與AudioLM兩種模型組合,並且對應多模運作框架,使其能聆聽、理解語言內容,並且藉由自動生成式人工智慧產生口說內容。
除了識別語音內容,並且進行自然互動之外,AudioPaLM更可對應多種語言翻譯功能,因此預期未來將能直接聆聽特定口語內容,隨即轉換成另一種語言呈現或許將能帶動更多跨語言溝通的便利性。
不過,目前此項技術仍處於研究階段,Google方面並未透露是否會將此技術應用在旗下諸如Google翻譯等服務,或是作為其他產品、服務應用。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
📌 數位新聞搶鮮看!
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 小米Tag開箱!拚當平替版AirTag 2 實測4大功能高CP
📢 iPhone Fold不是傳聞「真的生產中」!最終手機渲染圖曝光 果粉好兩難
📢 三星爆有4款新摺疊機!神祕新機型號現身 傳為平價Galaxy Z Fold8 FE
📢 Insta360 Snap手機自拍螢幕開箱!實測磁吸手機主鏡頭取景超讚
📢 iPhone鬧鐘又罷工!苦主看著它跳出來聲音卻不響 2方法解決
📢 安卓跳槽愛瘋「用到懷疑人生」!2功能超難戒 內行反推蘋果最大優勢