18+

AI生成圖片文字不再是亂碼!Google推Nano Banana Pro文字呈現大進化

Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其為目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(圖/翻攝自Google DeepMind頻道)
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其為目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(圖/翻攝自Google DeepMind頻道

Google 正式發表全新的AI圖像生成模型「Nano Banana Pro 」,這是今年推出的Nano Banana升級版本,標榜以最新、最強大的Gemini 3 Pro模型作為核心。Google表示,Nano Banana Pro是目前旗下最擅長生成文字內容的圖像模型,不論是標語、完整段落,甚至多語言文字,都能呈現清晰、正確且可閱讀的字體。

許多AI生成 圖片時,在文字方面往往會製作成亂碼,或者根本不存在的文字,不過根據外媒「MacRumors」報導,Google最新推出的Nano Banana Pro在產生海報、模型示意圖等內容時,能支援更多種字體、材質與文字風格。Google強調,新模型也更適合製作需要大量資訊的素材,例如資訊圖表或教學示意圖。使用者可讓模型連結Google搜尋,取得即時資料並融入生成的圖像中,呈現比以往更豐富的內容。

Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標...
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其為目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(Google提供)

Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標...
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其為目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(Google提供)

Google也表示,Nano Banana Pro提升了圖像的一致性處理能力,使用者最多可上傳 14 張圖片,並能讓模型維持多達五個人物外貌的一致性,這對需要製作多張風格統一的素材相當有用;而在圖像編輯方面,Nano Banana Pro提供更精細的局部編輯功能,讓使用者能針對特定區域進行調整,包括變更視角、焦距、色彩與光線效果等,並支援最高4K的圖像輸出品質。

隨著Nano Banana Pro上線,Google也為Gemini加入辨識AI生成影像的能力。所有Google AI生成的圖片都會嵌入SynthID辨識資訊,且免費 與AI Pro方案用戶生成的圖片會顯示可見浮水印 ,以便識別到底是否為AI生成。

Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標...
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其為目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(Google提供)

Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標...
Google正式發表全新的AI圖像生成模型「Nano Banana Pro」,標榜其為目前旗下最擅長生成文字內容的圖像模型,多語言文字也能呈現清晰、正確且可閱讀的字體。(Google提供)

延伸閱讀

Google在台灣設立AI研發中心!工作內容、為何建立、台美實驗室差異一次看

直擊Google最新台灣士林辦公室、實驗室!Logo藏台灣工程師心血、電力還能送回台電

蘋果繼「一塊布」再出第2彈「手機支架」!定價嚇一跳 為無障礙友善打造

音質太好!日人在中國駐日大使館前「狂放館長錄音檔」 網歪樓「音響哪家」曝光了

本日熱門 本周最熱 本月最熱