此次在GTC 2021中,NVIDIA 再次針對Jarvis開發工具進行更新,進一步加入互動對話學習框架,藉由GPU加速學習使整體反應時間可控制在100毫秒內,在聆聽說話內容後,即可在眨眼之間做出合適回應內容,甚至可以即時翻譯成不同語言呈現。
從早期提供擬真互動介面,並且能對應自然流暢語音互動,Jarvis在此次更新更加入語音理解後翻譯功能,目前支援英語、日語在內5種語言即時護譯,未來將會陸續加入支援更多語言。在進一步說明中,NVIDIA也確認將與Mozilla 同聲計畫 (Common Voice)合作,透過Mozilla累積多種語言聲音內容,讓Jarvis能持續學習更多語言內容。
同時,NVIDIA也說明Jarvis本身就已經完成前期訓練,使用者可以輕易進行客製化,並且佈署在雲端或終端裝置使用,藉此對應語音識別、轉錄、內容摘要、即時翻譯、字幕顯示、虛擬助理,或是聊天機器人等應用。
另外,藉由NVIDIA旗下技術與Jarvis開發工具打造的NVIDIA Maxine解決方案,則可讓線上會議應用變得更加真實,例如可在會議過程讓講者敘說內容透過即時翻譯,可藉由字幕形式以另一種語言呈現,甚至直接轉譯成另一種語言陳述。
而在會議過程中遇到網路頻寬不足情況,亦可透過人工智慧方式讓原本畫質不佳的影像變得清晰,甚至針對與會者有時候不會專注於鏡頭情況,同樣可以透過人工智慧方式「修正」,讓另一方與會者更有參與感。其他應用部分,也包含可套用即時擴增實境影像、聲音調整或影像特效等。
目前NVIDIA Maxine解決方案將與諸多線上會議系統、直播服務合作應用。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》