
先前由Elon Musk (馬斯克 )預告將推出的xAI 新一代人工智慧 模型Grok 3 ,稍早正式在「X」平台上的發表活動正式揭曉,並且標榜將發展目標放在理解宇宙真理,計畫用於探索外星生命等難題。
不意外地,xAI團隊也將Grok 3的推論beta版本、mini版本與坊間目前常見的人工智慧模型作比較,其中包含DeepSeek R1、OpenAI o1、Google Gemini -2 Flash Thinking等,強調Grok 3在推論能力超越這些人工智慧模型,並且在數學 (AIME'24)、科學 (GPQA)與程式設計 (LCB Oct-Feb)等領域也取得性能 領先表現。
跟其他人工智慧模型一樣,Grok 3也提供包含「DeepSearch」、「Think」與「Big Brain」在內多種模式,並且具備自動修正能力,藉此糾正錯誤或推論盲點,減少「睜著眼睛說瞎話」的情況發生。
整體性能表現:

聊天機器人應用表現:

推論與測試時運算表現:

其中「Big Brain」可視為Grok 3最完整性能版本,可解決複雜的問題組合,甚至可以透過理解兩種不同風格的遊戲內容,進而「構思」創造全新遊戲作品,而則預期可讓Grok 3以較長思考時艱進行推論,藉此獲得更正確的答案,至於「DeepSearch」則預期是等同Google、OpenAI等業者提出同名功能,讓人工智慧模型可針對特定提問內容進行深度分析,並且彙整報告內容。
— Elon Musk (@elonmusk) February 18, 2025
此外,Elon Musk強調Grok 3是以大量合成數據進行訓練,因此不會有資料授權、竊取資料等風險,另外也導入人類回饋迴路與情境訓練,能藉由前者以人工審核、提供反饋意見等方式修正人工智慧模型給出答案的準確性與關聯度,而後者則會透過不同情境讓Grok 3理解各類內容的前後文連接邏輯,以及使用者提問背後意圖等,藉此產生更符合預期解答的內容。
Elon Musk表示,xAI初期僅擁有8000組訓練用的GPU加速器,後續才追加10萬組NVIDIA H100 GPU加速器,並且花費約122天時間成安裝,再以92天時間將GPU加速器數量增加至20萬組 (其中包含H100與H200)。而Grok 3主要是在xAI建造全球最大人工智慧超級電腦「Colossus」完成,而後續也確定會繼續增加NVIDIA的B200 GPU加速器,藉此提升超級電腦運算性能。
目前Grok 3將優先開放X Premium+付費訂閱用戶體驗,之後將推出「深度思考模式」 (thinking harder mode)和「超級Grok」 (supergrok)版本,預計以每月30美元價格提供使用,另外也會推出Grok 3語音版本,更計畫用於Tesla車款,最快會在接下來的幾天內推出,讓Tesla車主能透過聲控方式與車輛互動。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》