影片版Nano Banana？Google升級AI創意工作室「Flow」導入Gemini Omni模型與全能助理

2026-05-20 08:21

聯合新聞網／ 楊又肇

在去年的Google I/O 2025開發者大會上，Google首度揭曉專為影像創作者打造的AI影音編輯工具「Google Flow 」，隨後更擴展出專注於音樂創作的「Google Flow Music」。時隔一年，Google再次為這套AI創意套件帶來火力升級。在今年的Google I/O 2026大會上，Google宣布為Flow系列工具導入全新世代的Gemini Omni 模型、能夠自主規劃任務的代理助理、無需寫程式就能自製工具的「Flow Tools」，並且正式推出行動版App。這意味著，Google正試圖將影音創作的門檻降至最低，並且將其打造成一個無縫銜接靈感到成品的「全自動化」創作工作站。

Google Flow重大更新：Gemini Omni模型加持，精準掌控每一格畫面

針對影像創作的Google Flow，本次更新聚焦於三大核心能力的躍進：

•Gemini Omni Flash模型的強勢入駐：

Google產品副總裁Elias Roman將其形容為「影片版的Nano Banana」 (Nano Banana 2，即Gemini 3 Flash Image)。這款模型大幅提升AI對物理世界與多模態的理解能力，允許創作者將現實世界的靈感 (如影片或圖像)與生成的內容完美融合，並且能透過「對話」的方式進行反覆迭代。

更重要的是，Gemini Omni Flash解決過去AI影片最為人詬病的「角色一致性」 (Character consistency)問題，確保主角的外貌與聲音在不同場景中能保持高度連貫。

此功能將開放給全球的Google AI訂閱用戶。

•Google Flow Agent (全能代理助理)：

這是你專屬的數位製片人。這個基於Gemini模型的助理，能深度理解你的專案脈絡，不僅能幫你腦力激盪、建議劇情走向，還能為特定場景的對白提供建議。

進入後期製作時，它甚至能幫你一次生成多個版本供挑選、進行批次修改，並且自動為素材命名與分類。

該助理將對全球所有Flow用戶免費開放。

•不會寫Code也能自製工具的「Flow Tools」：

使用者現在只需透過「自然語言」，就能在Flow內開發專屬的擴充工具 (例如特定的濾鏡、影片縮放器等)，完全不需要具備任何程式背景，甚至能將這些自製工具分享給社群，讓其他人進行「Remix」。

Google Flow Music更新：區塊精準編輯與AI音樂錄影帶

搭載最新Lyria 3 Pro模型的Google Flow Music，在此次更新則是賦予音樂人更細緻的控制權：

•精細到「區塊」的局部編輯：音樂創作者現在可以框選歌曲中的「特定段落」進行修改，例如瞬間改寫或翻譯某句歌詞、重塑某個節拍的風格，完全不會影響到整首曲子的其他部分。

•一鍵生成Cover (翻唱/改編)版本：可以在保留原始旋律與歌曲結構的前提下，徹底改變整首歌曲的風格。例如將一首重金屬搖滾，一鍵轉換成適合讀書時聆聽的「Lo-fi」版本。

•結合Gemini Omni模型的MV生成功能：透過導入Gemini Omni模型，使用者可以直接與AI對話，透過文字引導視覺風格、主體與場景，生成與音樂節奏完美契合的專屬音樂錄影帶 (MV)。此功能同樣限Google AI訂閱用戶使用。

行動版App正式亮相，隨時捕捉靈感

為了讓創作者不受場域限制，Google正式推出這兩款工具的行動應用程式 (Mobile Apps)。目前，Google Flow App已經率先在Android平台推出Beta版本 (iOS版本即將上線)；而Google Flow Music App則已經在iOS平台上線 (Android版本即將推出)。

雖然網頁版依然是獲得最完整功能的首選，但行動版App的推出，將為日常的靈感捕捉與即興創作提供了極大彈性。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

📌 數位新聞搶鮮看！