
去年在GTC 2024活動上公布針對人型機器人 打造的Project GR00T基礎模型,藉此推動人型機器人應用發展,NVIDIA 今年更在GTC 2025宣布推出全球第一個開放式人型機器人基礎模型Isaac GR00T N1,另外更與Google DeepMind、Disney Research合作開發下一代開源Newton物理引擎,讓機器人能學習如何更精準地處理複雜任務。
讓機器人能像人類更快反應、更熟思深慮運作的Isaac GR00T N1基礎模型
Isaac GR00T N1基礎模型採雙系統架構,並且參考人類認知原理為設計,其中以「系統1」可像是人類反射或直覺般快速思考,而「系統2」則仿照人類深思熟慮,以緩慢思考方式做出有條理的決策。

在設計中,「系統1」將作為驅動機器人身上連續動作的基礎,主要是透過Omniverse平台以人類示範動作數據進行訓練,讓機器人能更流暢且準確地執行任務,而「系統2」則會配合視覺語言模型,參考身處環境與接收到的指令在內資訊進行推理,並且做出合適決策。
藉由Isaac GR00T N1基礎模型,將可讓機器人順利執行諸如透過單手或雙手抓取、移動物品,甚至可將物品從手臂換至另一個手臂,或是執行更多複雜指令動作,例如用於搬運重物、進行物品包裝或檢查,而開發者或研究人員更可透過真實數據及合成數據針對Isaac GR00T N1基礎模型進行後期訓練。
而在此次展示中,NVIDIA執行長黃仁勳更以挪威機器人公司1X Technologies的NEO Gamma人型機器人示範,透過Isaac GR00T N1基礎模型以少量後期數據訓練,就能使其自主執行整理家務工作。
同時,包含Boston Dynamics、Agility Robotics、Mentee Robotics及NEURA Robotics在內機器人業者,目前都已經開始導入Isaac GR00T N1基礎模型,讓人型機器人能以更像人類形式運作,並且能真正解決目前勞力短缺問題。
攜手Google DeepMind、Disney Research,讓機器人學習精準處理複雜任務
除了推出Isaac GR00T N1基礎模型,NVIDIA更宣布與Google DeepMind、Disney Research合作開發全新開源物理引擎Newton,讓機器人能學習如何更精準處理複雜任務,預計會在今年底提供。

Newton採NVIDIA Warp框架設計,可針對機器人學習進行最佳化,更相容Google DeepMind的MuJoCo及NVIDIA Isaac Lab等模擬學習框架,更計畫讓此開源物理引擎能取用迪士尼開發的物理引擎。
在此次合作中,NVIDIA更與Google DeepMind合作開發可讓機器人學習負載加快70倍的MuJoCo-Warp框架,並且將Google DeepMind的MJX開源函式庫,以及此次提出的開源物理引擎Newton提供給更多開發人員使用。
而與Disney Research合作部分,則是使其能將此開源物理引擎用於迪士尼的娛樂用途機器人,例如在迪士尼樂園使用的機器人。在此次展示更再次透過去年曾在GTC 2024活動上亮相、以《星際大戰》為靈感開發的BDX機器人作為示範,使其展現徐徐如生的機器人互動情境。

解決訓練機器人所需大量數據難題
為了解決訓練機器人必須使用大量數據的難題,NVIDIA此次也針對機器人訓練需求提出能產生大量合成動作示範數據的NVIDIA Isaac GR00T Blueprint,其以Omniverse及Cosmos Transfer世界基礎模型為設計,透過少量由真人示範動作的真實數據,即可產生大量可用於訓練機器人的合成數據。

NVIDIA指出,NVIDIA Isaac GR00T Blueprint技術可在11小時內產生多達78萬個合成動作軌跡,幾乎等同時間長度達6500個小時、連續9個月的真人示範動作資料量。
若與使用人類真實動作數據進行訓練,透過NVIDIA Isaac GR00T Blueprint產生數據訓練Isaac GR00T N1基礎模型的效率約可提升40%。
另外,NVIDIA也推出GR00T N1數據集,同樣將以開源形式提供使用,藉此縮減開發者、機器人廠商建構訓練資料所需時間,進而加快機器人應用服務進入市場腳步。
目前GR00T N1訓練資料與任務評估情境已經可以透過Hugging Face及GitHub下載使用,而用於產生合成示範動作數據的NVIDIA Isaac GR00T Blueprint,則可在NVIDIA官網以互動展示形式提供,並且可透過GitHub下載。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》