
OpenAI 稍早公布其名為「o1 」的自然語言模型 ,標榜能以較多時間進行"思考",藉由推論、以不同方式解決問題,並且能從錯誤中修正,藉此增加解答準確率。
自然語言模型預期就是先前傳聞代號「Strawberry」的產品,強調如真人般思考,同時也會從經驗中學習。
跟其他自然語言模型一樣,OpenAI在推出「o1」預覽版本之餘,同時也提供對應輕量化運算需求、反應速度更快的「o1-mini」。前者目前僅開放OpenAI服務付費用戶測試,同時現階段也有嚴格的30組訊息使用量限制,而後者則同樣僅限付費用戶使用,並且限制50組訊息使用量。
跟先前推出的GPT系列模型不同,「o1」採用不同命名方式,似乎意味將採用不同產品發展策略,同時「o1」本身不具備網路瀏覽功能,同時也無法由使用者上傳文件或圖像,基本上就是透過模型訓練基礎,以及持續與人互動學習結果進行成長。
而「o1」在運算過程會考量問題本質,以及解答內容的正確性,因此在物理、化學、生物學,以及包含數學、程式編碼表現更為突出,但相對在運算執行速度會花費更多時間進行驗證,與GPT系列模型主要透過資料比對歸納結論的方式不同,「o1」會更著重在解答內容是否正確、與提問內容邏輯是否相符等。
以解答國際數學奧林匹克競賽測驗內容中,OpenAI表示GPT-4o的解答正確率僅有13%,但「o1」的正確率則提升至83%。
不過,雖然花費更多時間檢查、驗證,讓實際得出解答正確率更高,並不代表「o1」不會像GPT系列模型有"睜著眼睛說瞎話"情況,實際解答內容可能還是需要由人類作最終確認。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 「找車位神器」3秒搜出停車格!5縣市可用 駕駛實測嘆:相見恨晚
📢網紅「小周牙醫」歧視同志言論挨轟!道歉被網抓包IG、YT秒做1事:沒誠意
📢 Switch 2台北體驗會7/5登場!抽選制、超詳細報名規則曝
📢 ASUS VivoWatch 6 AERO智慧手環開箱!指尖量心電圖 睡眠追蹤曝「9成全淺眠」
📢 YouTube會員台灣便宜雙人方案來了!價格比印度貴近4倍 規則一次看
📢 獨/等到iPhone嗶進站!蘋果iOS18.4開放台灣NFC交易 悠遊卡公司回應了