18+

藉由推論、以不同方式解決問題 OpenAI推出能花費更多時間「思考」的自然語言模型「o1」

OpenAI 稍早公布其名為「o1 」的自然語言模型 ,標榜能以較多時間進行"思考",藉由推論、以不同方式解決問題,並且能從錯誤中修正,藉此增加解答準確率。

自然語言模型預期就是先前傳聞代號「Strawberry」的產品,強調如真人般思考,同時也會從經驗中學習。

跟其他自然語言模型一樣,OpenAI在推出「o1」預覽版本之餘,同時也提供對應輕量化運算需求、反應速度更快的「o1-mini」。前者目前僅開放OpenAI服務付費用戶測試,同時現階段也有嚴格的30組訊息使用量限制,而後者則同樣僅限付費用戶使用,並且限制50組訊息使用量。

跟先前推出的GPT系列模型不同,「o1」採用不同命名方式,似乎意味將採用不同產品發展策略,同時「o1」本身不具備網路瀏覽功能,同時也無法由使用者上傳文件或圖像,基本上就是透過模型訓練基礎,以及持續與人互動學習結果進行成長。

而「o1」在運算過程會考量問題本質,以及解答內容的正確性,因此在物理、化學、生物學,以及包含數學、程式編碼表現更為突出,但相對在運算執行速度會花費更多時間進行驗證,與GPT系列模型主要透過資料比對歸納結論的方式不同,「o1」會更著重在解答內容是否正確、與提問內容邏輯是否相符等。

以解答國際數學奧林匹克競賽測驗內容中,OpenAI表示GPT-4o的解答正確率僅有13%,但「o1」的正確率則提升至83%。

不過,雖然花費更多時間檢查、驗證,讓實際得出解答正確率更高,並不代表「o1」不會像GPT系列模型有"睜著眼睛說瞎話"情況,實際解答內容可能還是需要由人類作最終確認。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

延伸閱讀

曾提前8天神準預測凱米颱風侵台 氣象署再搬出AI追蹤輕颱貝碧佳

科技大咖齊聚白宮談AI能源建設 黃仁勳再談Blackwell

白宮將成立新工作小組 討論AI基礎設施需求

OpenAI推理模型上線 以人類思維答題專門應付數理

本日熱門 本周最熱 本月最熱