18+

亞馬遜推自有Nova系列自動生成式人工智慧模型 更推出可生成影像、影片的衍生版本

在re:Invent 2024大會演講中,亞馬遜 執行長Andy Jassy宣布名為Nova的自有多模態自動生成式人工智慧 模型,並且區分Micro、Lite、Pro及Premier四種規模版本,另外更針對影像生成需求推出名為Nova Canas的模型,同時也宣布推出可自動生成影片內容的Nova Reel。

此次揭曉四種規格版本,包含Micro、Lite、Pro都已經可提供AWS用戶使用,而Premier則要等到2025年第一季才會對外開放。

亞馬遜標榜Nova系列模型能帶來高達75%的成本效益,並且能以更快速度產生內容,更可透過微調方式提高生成準確性。

其中,規模最小、僅對應文字內容生成的Nova Micro,在整體精度表現比起Google Gemini 1.5Flash 8B、Meta Llama 3 .1 8B更高,而Nova Lite雖然在視覺理解表現略輸Claude 3.5 Sonnet V2、GPT-4o、Gemini 1.5 Pro及Llama 3.2 90B,但整體表現依然較好。

而同步推出的影像生成模型Nova Canas,則是針對藝術創作使用需求打造,並且強調比Dall-E 3、Stable Diffusion 3.5 Large能有更高生成準確率,更可在短時間內生成輸出。

至於對應影片生成的Nova Reel,則可對應橫移、360度環繞,或是縮放等拍攝視角,目前僅可生成6秒時間長度影片,但亞馬遜表示很快將能推出可生成2分鐘時間長度影片版本。

亞馬遜更說明此次推出的自動生成式人工智慧模型產生內容有高度可控,並且透過數位浮水印等識別方式避免造成以假亂真情況,強調以負責任形式提供此類工具

不過,亞馬遜並未透露其自有人工智慧模型訓練數據來源,僅說明是透過特定專用數據,以及授權使用數據交叉訓練而成。

另外,亞馬遜更透露接下來將擴展至語音生成語音 (speech to speech)的應用模式,預計會在2025年第一季推出,並且將在之後接續擴展至任何形式均可輸入、生成的使用模式,意味使用者可透過文字生成影片,或是將影片內容轉換為文字描述等,屆時預期將讓自動生成式人工智慧模型能有更多應用形式。

但亞馬遜此次並未公布市場傳聞的下一版Alexa數位助理服務,或許會等到其自動生成式人工智慧模型應用發展至一定程度,才會有更進一步說明。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱