Google提出名為Parti的文本轉圖像技術,透過輸入文字敘述內容,即可快速生成對應圖像結果。
Parti是透過200億組輸入資料進行訓練,全名為「Pathways Autoregressive Text-to-Image」 (路徑自回歸模型文本轉圖像),同時隨著可使用參數增加,所生成圖像也會更逼真。
而為了避免造成額外影響,目前Google並未透過公眾內容訓練Parti,避免產生潛在偏見風險。
在訓練過程中,Google更表示會加入一些「噪訊」進行干擾,藉此讓人工智慧在訓練過程產生對抗生成訓練效果,避免生成結果變成千篇一律,同時也能讓生成結果精度提高。
目前在市場上類似的技術越來越多,除了Google此次提出的Parti,還包含先前由NVIDIA提出的GauGAN,或是OpenAI提出的Dall-E,以及諸如VQ-GAN+CLIP 和 Latent Diffusion Models等,均可透過簡單文字描述輸入,即可快速生成擬真影像。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
📌 數位新聞這裡看!
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 LINE免費貼圖6款!這款「不可瑟瑟」免任務用半年 卡娜赫拉慶耶誕新年
📢 AirPods 4主動式降噪款開箱!實測噪音消滅驚豔 佩戴貼合度、音質再進化
📢 蘋果史上最薄!iPhone 17 Air僅6.25mm厚度 但藏1隱憂被當「中階手機」
📢 《軒轅劍參》Switch完全版開箱!典藏畫冊勾出老粉絲情懷 妮可Q版外露
📢 石頭G20S Ultra掃拖機器人開箱!7.98cm超薄機身鑽低矮區 星陣導航輕鬆過障礙賽
📢 果粉超愛「關iPhone APP保持順暢省電」!專家搖頭:手機電池壽命更慘