更低延遲運作、成本效益更高的AI模型Gemini 2.5 Flash開始提供開發者使用

2025-04-19 09:21 聯合新聞網楊又肇

不久前在Google NEXT'25預覽更低延遲運作、成本效益更高的AI模型Gemini 2.5 Flash，目前已經開始向開發者提供測試。

相比Gemini 2.5 Pro能處理前後達100萬個詞元內容理解處理，並且能進行深度資料分析、在特定專業領域提供關鍵見解，或是在理解整個程式碼後進行複雜編碼工作，成為Google當前能力最高的人工智慧模型，Gemini 2.5 Flash則是提供更低延遲執行效率，以及更低使用成本，預期成為多數應用服務主力使用模型，同時也能保持一定執行處理正確率表現，適合用於製作互動虛擬助理，或是即時內容摘要工具。

而Gemini 2.5 Flash同時具備動態、可控的推理能力，可依照提問內容複雜度自動調整處理時間 (可視為「思考預算」考量)，針對可簡單回覆提問內容更快做出互動，同時開發者或企業也能設定使用成本，依照實際需求調整回應速度、準確率，藉此讓服務運作預算可更有效益地使用。

開發者可以透過Google AI Studio或Vertex AI平台調整Gemini 2.5 Flash「思考」時生成的詞元數量。若將詞元數量調整越低，其反應速度就會越快，反之則會以更多時間進行「思考」，而背後反應成本也會相對較高。

至於在Gemini 2.5 Flash的知識量，目前截至今年1月擷取內容，並且同樣支援文字、圖片、影片、音訊多模態輸入，但結果僅能輸出文字內容，同時定位上將取代原本的Gemini 2.0 Flash Thinking。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

📌 數位新聞搶鮮看！

　訂閱《科技玩家》YouTube頻道！
💡 追新聞》》在Google News按下追蹤，科技玩家好文不漏接！
📢 Apple Pay、信用卡搭北捷「只扣1元」是沒刷到嗎？官方曝扣款規則秒懂
 📢 iPhone來電畫面有2種！設計巧思超貼心滑動接聽、拒接方法一次看
 📢 DJI Mic Mini 2開箱！實測ASMR、降噪收音驚豔彩色磁吸前蓋可更換
 📢北捷Apple Pay信用卡嗶進站變「深蹲感應區」！官方曝設計原因：會再調整
 📢獨／STUDIO A遇蘋果漲價要求「補差價」 4關鍵自保：店家不一定免責
 📢 LINE免費貼圖4款！「蛤」字必下載爽用半年、熊大兔兔動態圖超Q

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者，目前為自由寫手與Mas...

Gemini 2.5 Flash Google AI 人工智慧

更低延遲運作、成本效益更高的AI模型Gemini 2.5 Flash開始提供開發者使用

楊又肇

推薦文章

用悠遊卡搭北捷…iPhone放口袋卻重複扣款！官方曝解法

台灣首次戰爭「行動斷網」演習！8月14縣市演練時間、規則曝光 QA一次看

LINE免費貼圖7款！LV精品款用到明年1月諧音哏「熱到兔」ㄅ級分快下載

國家級「行動斷網」演習完整指引！NCC揭3重點：勿用手機處理重要工作

住飯店YouTube忘了登出怎麼辦？教你用Google帳戶遠端強制退出

8月「行動斷網」演習手機降速2天為何排除南部？NCC曝真正原因

更低延遲運作、成本效益更高的AI模型Gemini 2.5 Flash開始提供開發者使用

楊又肇

推薦文章

用悠遊卡搭北捷…iPhone放口袋卻重複扣款！官方曝解法

台灣首次戰爭「行動斷網」演習！8月14縣市演練時間、規則曝光 QA一次看

LINE免費貼圖7款！LV精品款用到明年1月 諧音哏「熱到兔」ㄅ級分快下載

國家級「行動斷網」演習完整指引！NCC揭3重點：勿用手機處理重要工作

住飯店YouTube忘了登出怎麼辦？教你用Google帳戶遠端強制退出

8月「行動斷網」演習手機降速2天 為何排除南部？NCC曝真正原因

LINE免費貼圖7款！LV精品款用到明年1月諧音哏「熱到兔」ㄅ級分快下載

8月「行動斷網」演習手機降速2天為何排除南部？NCC曝真正原因