18+

影/OpenAI語音助理的回應有多厲害?幾乎輾軋Siri和Alexa

OpenAI發表了新的GPT-4o模型,含有語音助理新功能,即時回應的速度和內容令人驚艷。路透
OpenAI發表了新的GPT-4o模型,含有語音助理新功能,即時回應的速度和內容令人驚艷。路透

OpenAI發表了新的GPT-4o模型,含有語音助理新功能,即時回應的速度和內容令人驚艷,除了能像人類在正常對話中一樣快速回應、即興唱歌、能嘲笑不好笑的笑話或者自嘲,還能在相機鏡頭協助下,幫忙人類解決寫在課本上的數學問題。

OpenAI在YouTube頻道上張貼了16段影片,展示GPT-4o模型語音助理與人類的各種聊天互動,像是利用相機判斷使用者臉上的笑容表情、推測有快樂心情,判斷使用者穿了什麼顏色的衣服與身處的空間環境,藉此展開聊天話題。當使用者提到,今天有個發表會要介紹GPT-4o的語音助理時,「她」瞬間驚訝並害羞笑出來,回應說「我?是要介紹我?」

根據OpenAI說法,GPT-4o模型對語音輸入的反應最快可達0.232秒,實際上平均只要大約0.32秒就可回應,號稱與人類對話時的速度差不多。

這些影片中,除了大秀即時翻譯功能,展示者還在紙上寫了一道代數問題「3 X+1=4」詢問ChatGPT,語音助理利用相機鏡頭解讀算式之後,一步一步教導使用者解出答案。

另一段影片顯示使用者要求ChatGPT講一段床邊故事「機器人與愛」,在下指令希望語音助理的語調更具戲劇性後,ChatGPT立刻「變聲」,用演話劇的方式講故事,甚至馬上切換成機器人說話的語調,最後甚至唱了一段歌為故事畫下句點。

當然,GPT-4o模型同樣善於協助分析和撰寫程式碼,也能分析圖表,而且這回還是用語音生動地與使用者對話。

另一段影片還顯示,將兩台使用GPT-4o模型的手機放在旁邊時,「兩位」語音助理甚至能夠互相對話聊天、即興唱歌。

在其他影片中,GPT-4o模型還能嘲笑笑話、正確識別猜拳的獲勝者,也能根據蛋糕插了蠟燭來判斷這可能是某人生日,還唱了一首生日快樂歌。

對於這場發表活動,MarketWatch網站發表一篇文章,題為「OpenAI是否剛推出了Siri殺手?」有網友盛讚這把ChatGPT功能提升到了全新水準、「未來是如此光明」。

輝達高級研究科學家Jim Fan則指出,OpenAI的語音助理「生動逼真而且甚至有點輕浮」,還讓人回想起2013年的科幻電影「雲端情人」。

延伸閱讀

OpenAI新模型GPT-4o有語音助理 能唱歌還可打斷它說話

OpenAI推新模式GPT-4o 類人速度逼真對話反應超快

生成式AI生態浪潮洶湧 聯發科天璣在端側投下「定海神針」

傳美國考慮推動監管 防止中國取得先進AI模型

本日熱門 本周最熱 本月最熱