18+

影片版Nano Banana?Google升級AI創意工作室「Flow」導入Gemini Omni模型與全能助理

在去年的Google I/O 2025開發者大會上,Google首度揭曉專為影像創作者打造的AI影音編輯 工具「Google Flow 」,隨後更擴展出專注於音樂創作的「Google Flow Music」。時隔一年,Google再次為這套AI創意套件帶來火力升級。在今年的Google I/O 2026大會上,Google宣布為Flow系列工具導入全新世代的Gemini Omni 模型、能夠自主規劃任務的代理助理、無需寫程式就能自製工具的「Flow Tools」,並且正式推出行動版App。這意味著,Google正試圖將影音創作的門檻降至最低,並且將其打造成一個無縫銜接靈感到成品的「全自動化」創作工作站。

Google Flow重大更新:Gemini Omni模型加持,精準掌控每一格畫面

針對影像創作的Google Flow,本次更新聚焦於三大核心能力的躍進:

Gemini Omni Flash模型的強勢入駐:

Google產品副總裁Elias Roman將其形容為「影片版的Nano Banana」 (Nano Banana 2,即Gemini 3 Flash Image)。這款模型大幅提升AI對物理世界與多模態的理解能力,允許創作者將現實世界的靈感 (如影片或圖像)與生成的內容完美融合,並且能透過「對話」的方式進行反覆迭代。

更重要的是,Gemini Omni Flash解決過去AI影片最為人詬病的「角色一致性」 (Character consistency)問題,確保主角的外貌與聲音在不同場景中能保持高度連貫。

此功能將開放給全球的Google AI訂閱用戶。

Google Flow Agent (全能代理助理):

這是你專屬的數位製片人。這個基於Gemini模型的助理,能深度理解你的專案脈絡,不僅能幫你腦力激盪、建議劇情走向,還能為特定場景的對白提供建議。

進入後期製作時,它甚至能幫你一次生成多個版本供挑選、進行批次修改,並且自動為素材命名與分類。

該助理將對全球所有Flow用戶免費開放。

不會寫Code也能自製工具的「Flow Tools」:

使用者現在只需透過「自然語言」,就能在Flow內開發專屬的擴充工具 (例如特定的濾鏡、影片縮放器等),完全不需要具備任何程式背景,甚至能將這些自製工具分享給社群,讓其他人進行「Remix」。

Google Flow Music更新:區塊精準編輯與AI音樂錄影帶

搭載最新Lyria 3 Pro模型的Google Flow Music,在此次更新則是賦予音樂人更細緻的控制權:

精細到「區塊」的局部編輯:音樂創作者現在可以框選歌曲中的「特定段落」進行修改,例如瞬間改寫或翻譯某句歌詞、重塑某個節拍的風格,完全不會影響到整首曲子的其他部分。

一鍵生成Cover (翻唱/改編)版本:可以在保留原始旋律與歌曲結構的前提下,徹底改變整首歌曲的風格。例如將一首重金屬搖滾,一鍵轉換成適合讀書時聆聽的「Lo-fi」版本。

結合Gemini Omni模型的MV生成功能:透過導入Gemini Omni模型,使用者可以直接與AI對話,透過文字引導視覺風格、主體與場景,生成與音樂節奏完美契合的專屬音樂錄影帶 (MV)。此功能同樣限Google AI訂閱用戶使用。

行動版App正式亮相,隨時捕捉靈感

為了讓創作者不受場域限制,Google正式推出這兩款工具的行動應用程式 (Mobile Apps)。目前,Google Flow App已經率先在Android平台推出Beta版本 (iOS版本即將上線);而Google Flow Music App則已經在iOS平台上線 (Android版本即將推出)。

雖然網頁版依然是獲得最完整功能的首選,但行動版App的推出,將為日常的靈感捕捉與即興創作提供了極大彈性。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱