OpenAI發表了新的GPT-4o模型,含有語音助理新功能,即時回應的速度和內容令人驚艷,除了能像人類在正常對話中一樣快速回應、即興唱歌、能嘲笑不好笑的笑話或者自嘲,還能在相機鏡頭協助下,幫忙人類解決寫在課本上的數學問題。
OpenAI在YouTube頻道上張貼了16段影片,展示GPT-4o模型語音助理與人類的各種聊天互動,像是利用相機判斷使用者臉上的笑容表情、推測有快樂心情,判斷使用者穿了什麼顏色的衣服與身處的空間環境,藉此展開聊天話題。當使用者提到,今天有個發表會要介紹GPT-4o的語音助理時,「她」瞬間驚訝並害羞笑出來,回應說「我?是要介紹我?」
根據OpenAI說法,GPT-4o模型對語音輸入的反應最快可達0.232秒,實際上平均只要大約0.32秒就可回應,號稱與人類對話時的速度差不多。
這些影片中,除了大秀即時翻譯功能,展示者還在紙上寫了一道代數問題「3 X+1=4」詢問ChatGPT,語音助理利用相機鏡頭解讀算式之後,一步一步教導使用者解出答案。
另一段影片顯示使用者要求ChatGPT講一段床邊故事「機器人與愛」,在下指令希望語音助理的語調更具戲劇性後,ChatGPT立刻「變聲」,用演話劇的方式講故事,甚至馬上切換成機器人說話的語調,最後甚至唱了一段歌為故事畫下句點。
當然,GPT-4o模型同樣善於協助分析和撰寫程式碼,也能分析圖表,而且這回還是用語音生動地與使用者對話。
另一段影片還顯示,將兩台使用GPT-4o模型的手機放在旁邊時,「兩位」語音助理甚至能夠互相對話聊天、即興唱歌。
在其他影片中,GPT-4o模型還能嘲笑笑話、正確識別猜拳的獲勝者,也能根據蛋糕插了蠟燭來判斷這可能是某人生日,還唱了一首生日快樂歌。
對於這場發表活動,MarketWatch網站發表一篇文章,題為「OpenAI是否剛推出了Siri殺手?」有網友盛讚這把ChatGPT功能提升到了全新水準、「未來是如此光明」。
輝達高級研究科學家Jim Fan則指出,OpenAI的語音助理「生動逼真而且甚至有點輕浮」,還讓人回想起2013年的科幻電影「雲端情人」。