18+

OpenAI新模型GPT-4o有語音助理 能唱歌還可打斷它說話

OpenAI推出更高性能、更高效AI技術模型GPT-4o。美聯社
OpenAI推出更高性能、更高效AI技術模型GPT-4o。美聯社

OpenAI周一(13日)發表自家旗艦AI模型升級的新版本,不但速度更快、更便宜,還包含新的語音助理功能,讓它更容易使用,而且將免費開放給所有使用者。這是該公司擴大其聊天機器人ChatGPT應用的最新努力,此時正值Google和其他科技巨擘競相推動AI技術大突破。

新的AI模型名為GPT-4o,是其已經問世一年多的GPT-4模型的最新版本。OpenAI技術長穆拉蒂(Mira Murati)表示,最新模型能夠更好地消化圖片、影音短片與文字,還能透過​​語音與人類即時互動。該公司說,人們與新的語音功能交談時,能夠隨時打斷它,這和當前市面上的語音助理不同,而且新模型能夠幾乎即時地回話。

OpenAI主管們直播展示了這款模型如何分析程式碼、在兩個說話者之間翻譯語言,或是如何指導用戶解決寫在一張紙上的基本代數問題,而且全部幾乎都是即時的。

OpenAI發表新產品的時間點,正值Google周二展開年度開發者大會的前一天,預料Google將在大會上宣布自家的新產品。身為AI先驅的Google一直與OpenAI及其資助者間合作夥伴微軟爭奪生成式AI的領導地位。微軟並未參與打造GPT-4o。

穆拉蒂說,她的團隊「不知道Google目前的行動」,而且這次活動的時機純屬巧合。她說,周一的更新將「改變人類與機器互動的方式」。

她表示,OpenAI將免費提供新模型給用戶使用, 「這是一種非常具體的方式,讓我們提升為人人提供這些福利的使命。」

OpenAI執行長奧特曼把新產品比擬為電影中常見的AI工具。他去年在一場演講中表示,他和其他主管是在2013年的電影《雲端情人》找到靈感,該電影是有關一個男人愛上語音助理的故事。奧特曼和其他OpenAI員工在周一的新品發表後,在社群平台X上貼文,引述了這部電影。

奧特曼周一在個人社群平台貼文:「原本的ChatGPT顯示語言介面的可能性,這個新版讓人內心感覺不同。」

OpenAI表示,新模型還可以透過語調或臉部表情來偵測人的情緒。它也能更迅速在不同的情緒語調中做轉換,例如從戲劇化的聲音轉換成用機器人聲調、再到唱歌。這項功能將在數周內提供給每月支付20美元費用的ChatGPT-Plus付費用戶使用。

此外,該公司也將向企業提供GPT-4o模型。穆拉蒂說,這款模型速度將是目前其最高級產品GPT-4 Turbo的兩倍,但費用只為一半。該公司表示,GPT-4o中的「o」代表字根omni(完全、涵蓋全部的)。從周一開始,使用免費版本ChatGPT的用戶,將能使用GPT-4o中的圖像與視覺功能。

奧特曼說,公司的下一款AI模型將比GPT-4明顯更好。儘管外界普遍預期這款新AI模型將在2024年上半年亮相,但OpenAI試圖淡化這樣的預期。穆拉蒂表示,OpenAI可能會在2024年分享有關GPT-5的更新,但沒有表明具體時間。

延伸閱讀

OpenAI推新模式GPT-4o 類人速度逼真對話反應超快

奧特曼讓核能公司上市 為AI成長提供動力

MLB/隊友化身大谷評論家 奧特曼評這一轟只給「B」

MLB/道奇煙火秀迎布勒復出 大谷夯第11轟各種霸榜越來越狂

本日熱門 本周最熱 本月最熱