Google研究團隊提出可聆聽理解語音內容的AudioPaLM模型 還能自動生成口說內容
Google研究團隊近期提出一項名為AudioPaLM的大型自然語言模型,將能實現語音內容聆聽理解,並且自動生成口說內容。
AudioPaLM的背後是由PaLM 2與AudioLM兩種模型組合,並且對應多模運作框架,使其能聆聽、理解語言內容,並且藉由自動生成式人工智慧產生口說內容。
除了識別語音內容,並且進行自然互動之外,AudioPaLM更可對應多種語言翻譯功能,因此預期未來將能直接聆聽特定口語內容,隨即轉換成另一種語言呈現或許將能帶動更多跨語言溝通的便利性。
不過,目前此項技術仍處於研究階段,Google方面並未透露是否會將此技術應用在旗下諸如Google翻譯等服務,或是作為其他產品、服務應用。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
📌 數位新聞搶鮮看!
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 告別死板字體!LINE再推全新免費字體 3款選擇、設定方式懶人包一次看
📢 便宜資費懶人包/4G吃到飽真的變貴!5G攻399元更划算
📢 LINE免費貼圖!它能自訂文字爽用到9月、「又沒錢了」日常哏圖超好用
📢 蛤?俄警活逮男子…抓到一半開玩VR遊戲「砍方塊」 嫌犯在旁觀看
📢 LINE免費貼圖!初音未來超可愛、這款「狗沒拿賽」諧音哏滿滿
📢 大學生購機指南!筆電或桌機?Mac還是Windows?過來人曝抉擇關鍵