18+

真正「會思考」的AI!Google釋出最強模型Gemini 3.1 Pro 核心推論能力翻倍躍進

人工智慧的軍備競賽已經不再是幾個月一次,而是以「週」為單位在推進。Google正式揭曉其最新一代AI模型Gemini 3.1 Pro,官方將此次升級定義為「核心推論能力(Core Reasoning)的一大步」。不僅在各項基準測試中刷出新高,更將AI的能力邊界從單純的文字產出,大幅擴展到互動設計與創意程式開發領域。

跑分怪物誕生:ARC-AGI-2推論成績翻倍

在評估AI解決全新邏輯模式與抽象推理能力的權威測試ARC-AGI-2中,Gemini 3 .1 Pro繳出高達77.1%的驚人成績。相比前一代Gemini 3 Pro僅有31.1%的表現,這項關鍵指標呈現爆發性的翻倍成長。

這意味AI模型 在面對未知、沒有標準答案的複雜任務時,具備更強的解題與策略規劃能力。知名AI新創公司Mercor執行長Brendan Foody也公開讚賞,指出Gemini 3.1 Pro目前已登頂其APEX-Agents排行榜,證明AI代理程式在真實知識工作上的進步速度有多麼驚人。

不僅會寫Code,更懂「互動設計」與「視覺美感」

除了冷冰冰的跑分數據,Google也展示Gemini 3.1 Pro在實際跨模態應用上的三大殺手級升級:

• 程式碼 驅動動畫 (Code-based animations):只要輸入文字提示詞,Gemini 3.1 Pro 就能直接生成 網頁專用的SVG動畫。這類純程式碼生成的圖像不僅檔案極小,還能無限縮放不失真,開發者可直接將其嵌入網站中使用。

• 創意程式開發 (Creative coding):官方展示一個極具「氛圍感」的案例:模型能夠深度理解文學名著《咆哮山莊》 (Wuthering Heights)中角色的性格與小說氛圍,並且以此為基礎,為該角色 (假設她是一位風景攝影師)生成一整個帶有強烈視覺風格的專屬網頁。

• 沉浸式互動設計 (Interactive design):Gemini 3.1 Pro成功編寫出一個複雜的「3D椋鳥群飛」 (Starling murmuration)互動模擬器。使用者不僅能透過多種方式控制鳥群,系統還會根據鳥群的移動軌跡,即時動態生成相應的空間音效。

支援平台與上線時間

Gemini 3.1 Pro已經從即日起陸續向全球使用者開放。

• 一般消費端:訂閱Google AI Pro 或Ultra方案的用戶,已經能在Gemini App與NotebookLM中體驗這款最新模型。

• 開發者與企業端:企業客戶與開發人員可透過AI Studio、Gemini Enterprise、Google Antigravity代理開發平台,以及Android Studio存取最新的 Gemini API。值得一提的是,儘管效能大幅提升,其API定價仍與前代維持一致,加量不加價。

分析觀點

AI模型的競爭焦點,已經明確從「誰生成的字比較快」轉向了「誰想得比較深」。

在Claude Sonnet 4.6展現出接近人類基準線的電腦操作能力後,Google透過Gemini 3.1 Pro的「推論能力翻倍」與系統性升級做出強而有力的回應。這代表未來的AI將越來越能勝任需要「多步驟決策」與「跨模態整合」的代理工作 (Agentic Work)。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱