發票載具看毒油行動斷網蘋果BTS 5大電腦迷思風扇好用嗎懶人料理

18+

不只是會動的照片！Google發表Gemini Omni 能「看懂」世界、支援自然語言影音編輯

2026-05-20 08:28

聯合新聞網／ 楊又肇

Google 正式發表全新的多模態模型「Gemini Omni 」，並且率先釋出該系列的首款模型「Gemini Omni Flash」。有別於過去單純將文字轉化為動態影像的生成工具，Gemini Omni被定位為一個真正融合「推理能力」與「創作能力」的全能大腦。它不僅能處理文字、圖像、音訊與影片等複合式輸入，更能憑藉對現實世界物理定律的理解，讓創作者透過「對話」的方式，精準且連貫地對影片進行每一格的細部修改。

核心亮點一：用「聊天」來剪片，而且不怕角色走鐘

過去使用AI編輯影片最大的痛點，就是只要換了一個場景，主角的長相、衣服或背景細節就會發生「突變」。

Gemini Omni最大的突破，在於它具備強大的「上下文記憶」與「角色一致性」 (Character consistency)。Google DeepMind技術長Koray Kavukcuoglu表示，使用者現在可以透過自然語言，以漸進式、多輪對話的方式來編輯影片。

例如，你可以先請AI將影片中的雕像變成泡泡材質；接著在下一個指令中，要求主角觸碰鏡面時，手臂也跟著變成反光材質。在這些連續的修改過程中，場景的物理狀態與角色特徵都不會跑位。

核心亮點二：結合物理直覺與世界知識的「說故事能力」

Gemini Omni的強大不僅在於視覺上逼真，更在於其底層融入Gemini對歷史、科學與文化的龐大知識庫，以及對物理學的「直覺」。

•符合現實的物理動態：Gemini Omni針對重力、動能與流體力學進行深度學習。當你要求它生成「一顆彈珠在機關軌道上快速滾動」時，它能精準模擬出物體碰撞與落下的真實物理反應，而非只是套用預設的動畫模組。

•將抽象概念視覺化：你可以給出極其複雜且具邏輯性的指令 (例如：用黏土動畫的風格，依序生成英文字母A到Z開頭的奇特物品，並且在左下角標註字母)。Gemini Omni能理解這些帶有序列與邏輯限制的指令，並且生成符合科學知識的視覺解說。

核心亮點三：任意混搭的「多模態輸入」與數位分身

Gemini Omni徹底打破輸入素材的界線。創作者可以同時丟給它一張參考圖片、一段音樂節奏，以及一段文字描述，要求它生成一支風格統一的影片。例如：「請根據這張手繪草圖，配上這段復古音樂的節奏，生成一段賽博龐克風格的走路動畫」。

此外，在確保負責任的AI政策下，Google率先推出了「數位分身」功能。使用者可以建立自己的數位版本，並且透過語音驅動生成外觀與聲音都與自己相符的影片。為防止濫用，所有透過Gemini Omni生成的影片都會強制嵌入人類無法察覺的SynthID數位浮水印。

而Google更強調與C2PA內容來源與真實性聯盟深度合作，藉此確認哪些內容是透過AI技術生成。除了與NVIDIA簽署SynthID數位浮水印合作，目前包含OpenAI、KAKAO、IIElevenLabs也加入此合作協議。

分析觀點：從「素材生成器」進化為「AI導演」

如果說去年的Nano Banana讓大家見識到AI圖片生成的威力，那麼今年的Gemini Omni則是直接跨越「生成素材」的階段，開始挑戰專業剪輯軟體的地位。

Gemini Omni最可怕的地方，不在於它的畫質有多高，而是它的「推理」與「理解」能力。它解決AI影片長期以來「缺乏邏輯」與「難以微調」的致命傷。透過多輪對話，它讓任何人都能像坐在剪接師旁邊一樣，用一張嘴就能完成去背、改材質、加特效等繁複的後期工作。

這不僅是AI技術的火力展示，更將徹底改寫YouTube創作者與好萊塢製片人的工作流。

上市資訊：

Gemini Omni首款模型「Gemini Omni Flash」將從即日起正式向全球的Google AI Plus、Pro與Ultra訂閱用戶開放使用，可透過Gemini App與Google Flow進行體驗。

此外，自本週起，YouTube Shorts與YouTube Create App的使用者也能免費使用這項功能。未來幾週內，Google也將透過API形式將其開放給開發者與企業客戶。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

📌 數位新聞搶鮮看！

　訂閱《科技玩家》YouTube頻道！
💡 追新聞》》在Google News按下追蹤，科技玩家好文不漏接！
📢 Apple Pay、信用卡搭北捷「只扣1元」是沒刷到嗎？官方曝扣款規則秒懂
📢 iPhone來電畫面有2種！設計巧思超貼心滑動接聽、拒接方法一次看
📢 DJI Mic Mini 2開箱！實測ASMR、降噪收音驚豔彩色磁吸前蓋可更換
📢北捷Apple Pay信用卡嗶進站變「深蹲感應區」！官方曝設計原因：會再調整
📢獨／STUDIO A遇蘋果漲價要求「補差價」 4關鍵自保：店家不一定免責
📢 LINE免費貼圖4款！「蛤」字必下載爽用半年、熊大兔兔動態圖超Q

找資料免大海撈針！Google全新「Ask YouTube」與 Workspace「Live」對話互動功能

AI在忙什麼？Google預覽全新「Android Halo」介面無縫追蹤Gemini Spark運作狀態

iPhone 20新外觀爆料！「手機邊框會隱形」、取消實體按鈕

iPhone 18為何蘋果秋季發表會消失？型號太複雜、果粉「2階段」大抉擇新機

教學／填資料好麻煩！iPhone內建「替代文字」 1秒輸入載具、收件地址

Google 音訊 Gemini Omni

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者，目前為自由寫手與Mashdigi網站 (mashdigi.com)創辦者身分，平常喜歡電玩、科技類新品，以及軟體、網路相關內容，也喜歡隨手撰寫內容介紹新玩意。

更多數位新品、技術介紹與科技趨勢內容：https://mashdigi.com/

「隱形陷阱」抓AI作弊！題目複製貼上 9成學生沒做1事被抓包

OpenAI測試失控發動網攻引疑慮阿特曼與黃仁勳將會美參院高層

NVIDIA、微軟、OpenAI聯名捍衛開源AI！Anthropic工程師酸爆：「期待CUDA與Windows也開源」

從螢幕走向生活：OpenAI宣示將ChatGPT帶入穿戴裝置打造無處不在的AI生態

20年前54億美元收購ATI的豪賭：AMD如何從CPU製造商蜕變為全方位AI巨頭

網傳月之暗面酒吧慶祝Kimi K3發佈現場豪言未來目標｢衝上月球｣

「悠遊卡比西瓜卡慢半拍」日網友超不解！網曝關鍵原因

iPhone 18為何蘋果秋季發表會消失？型號太複雜、果粉「2階段」大抉擇新機

《奧德賽》掀IMAX影廳搶票潮！為何影迷瘋美麗華解密電影院銀幕畫面差異

輝達顯卡再漲價！售價最高調升三成

飛利浦Baristina一滑極萃義式咖啡機開箱！懶人新手救星實測2操作滑出咖啡

蘋果App Store爆多項服務中斷！Apple Music不能用官方回應了

台北羽球公開賽曝「黑白賽程表」！網傻眼Word風格排版：連AI都懶得用

Google證實Pixel 11漲價！被爆漲3000元官方拚黑科技「節省記憶體使用量」

「隱形陷阱」抓AI作弊！題目複製貼上 9成學生沒做1事被抓包

住飯店YouTube忘了登出怎麼辦？教你用Google帳戶遠端強制退出

用悠遊卡搭北捷…iPhone放口袋卻重複扣款！官方曝解法

「悠遊卡比西瓜卡慢半拍」日網友超不解！網曝關鍵原因

台灣首次戰爭「行動斷網」演習！8月14縣市演練時間、規則曝光 QA一次看

LINE免費貼圖7款！LV精品款用到明年1月諧音哏「熱到兔」ㄅ級分快下載

國家級「行動斷網」演習完整指引！NCC揭3重點：勿用手機處理重要工作

住飯店YouTube忘了登出怎麼辦？教你用Google帳戶遠端強制退出

買iPad愈選愈頭痛？蘋果官方解密「四大主力機真實定位」購機有方向

8月「行動斷網」演習手機降速2天為何排除南部？NCC曝真正原因

iPhone 18為何蘋果秋季發表會消失？型號太複雜、果粉「2階段」大抉擇新機

任天堂Switch 2鑰匙卡「比純數位版便宜」？成本出爐玩家傻眼

巴威颱風走到哪裡了？看天氣最新動態、即時路徑 7平台吸千人報現況

iPhone免開手機嗶進北捷！7月1日啟用、教你設定「快速交通卡」行動支付

獨／PChome旗下Pi錢包遭駭客入侵 350萬用戶個資全都露

致癌油連環爆！發票載具APP推食安快篩功能命中品項、可退金額一次看清

Apple Pay刷北捷實測！1秒進站如日本西瓜卡但有3尷尬處悠遊卡要擔心了

台灣首次戰爭「行動斷網」演習！8月14縣市演練時間、規則曝光 QA一次看

蘋果BTS教育方案今年靜悄悄停辦？內行人爆料優惠登場時間

等到了！雙北搭公車「自動加值」開通不怕餘額不足、免跑捷運和超商

開「弱風」其實更搶錢！破解冷氣風速迷思 4方式更省電

2026台灣蘋果BTS方案來了！贈品縮水變禮品卡、買它省1萬1 優惠資格一次看