Google DeepMind宣布推出全新針對機器人打造的VLA (Vision-Language-Action)人工智慧模型「RT-2」,藉此讓機器人能更聰明地做出認知反應動作。
「RT-2」與先前在2022年底提出的「RT-1」類似,同樣藉由模型架構讓機器人可快速從經驗中學習,並且與其他機器人分享。在架構上同樣基於以自注意力機制設計的深度學習模型「Transformer」為基礎,可透過網路傳輸的文字、圖像進行訓練,進而讓機器人學習認知做出相應行為動作。
例如,傳統作法如果要讓機器人自動將空可樂罐丟進垃圾桶,過程中必須先讓機器人知道什麼是可樂罐,以及如何判斷可樂罐已經是空的,接著還必須訓練機器人如何夾取空可樂罐,並且將其正確地放到垃圾桶,但機器人在實際運作時仍無法知道為什麼要將空可樂罐丟進垃圾桶。
因此在「RT-2」模型設計中,會透過大量源自網路的數據訓練機器人,並且讓他知道什麼是「垃圾」,進而節省原本需要逐步訓練機器人辨識物體、判斷物體狀況,以及如何夾取、正確放進垃圾桶的繁瑣步驟,直接讓機器人知道物體在什麼狀態下可視為「垃圾」,以及垃圾桶實際用途,即可加快機器人學習將所見「垃圾」丟進垃圾桶的行為。
相比「RT-1」模型下的執行效率為32%,透過「RT-2」的執行效率則提高為62%,幾乎足足增加將近2倍效果,因此預期能接續透過「RT-2」模型訓練機器人理解更多操作行為。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 鳳凰颱風走到哪裡了?看颱風最新動態、即時路徑 6平台吸千人24小時報現況
📢 日本西瓜卡升級新功能!儲值上限變30萬日圓、吉祥物Suica企鵝2026下台告別
📢 iPhone 20告別瀏海與挖孔!蘋果首款全螢幕無開孔手機長這樣
📢 懶人包/普發一萬領現金最安心!指定ATM去哪找?LINE一鍵查詢領錢管道
📢 三星Galaxy S26+渲染圖外觀曝光!旗艦機Galaxy S26 Ultra自拍能塞更多人
📢 蘋果HomePod mini 2「推出機率更高」!零售商「停產」洩密 新品功能曝光

登(加)入 udn 會員不只享專屬優惠,現在再送 LINE POINTS 5 點!即日起至 11/20,不論新朋友或老朋友,輕鬆加入就有獎 ( 每日限量 1,000 組,不定時放送 ),馬上入手點數,讓生活多一點開心回饋。