針對目前人形機器人 面臨的軟硬體整合痛點,NVIDIA 機器人產品總監黃勝斌 (Spencer Huang)說明此次NVIDIA提出的Isaac GR00T參考設計與開源全能世界模型Cosmos 3,不僅進一步降低機器人開發門檻,更透過「先思考、後行動」的邏輯,重構機器人進入實體世界的運作流程。
硬體整合挑戰與Isaac GR00T參考設計
機器人開發目前面臨最大的挑戰之一,並非單純的軟體運算,而是「讓機器人順利作動」的底層硬體整合問題。黃勝斌指出,不同的機器人底盤與靈巧手部作動,往往需要耗費團隊數個月時間進行大量韌體與驅動層的整併與調校。
為解決此問題,NVIDIA推出開源的Isaac GR00T參考設計,並且直接與宇樹科技 (Unitree Robotics) 合作人形機器人底盤,更與Sharpa Wave合作具備五指觸覺且動作靈巧的機器手臂。透過提供標準化的軟硬體堆疊架構、預先測試的驅動程式與中介軟體 (Middleware),讓開發者能將運算資源直接配置在機器人本體上,使得研究人員與開發者可以跳過繁瑣的硬體調整、除錯階段,將精力集中於上層的技能訓練與資料生成,大幅縮短將AI模型佈署至實體設備的時程。
同時,黃勝斌也說明機器人運作過程,通常會需要透過手部模擬人類夾取、搬運等動作,甚至因為不同佈署應用需求,會需要配置不同的手臂設計,例如單純夾取物品可能僅需簡易的二指手臂,但是針對需要更輕柔力道,或是需要正確操作精度的情況,機器人的手部動作就會顯得更重要,但往往也需要花費時間進行訓練,因此NVIDIA希望透過前期提供可立即應用的參考設計,讓更多機器人可以在更短時間內佈署於工作環境。
Cosmos 3世界模型:與Omniverse的互補與進化
在軟體與模型架構層面,NVIDIA推出的開源全能世界模型Cosmos 3,成為重構實體AI開發流程的關鍵核心。探討Cosmos 3的定位時,必須釐清它與既有Omniverse平台 (如Isaac Sim)的差異:
•Omniverse (傳統模擬器):具備極高的物理擬真度與精準的基礎真實性 (Ground Truth),但缺點是需要大量人工建置數位資產 (Assets) 與環境,擴展性受限於事先建置速度。
•Cosmos 3 (神經網路模擬器):屬於從大量預先訓練資料中「學習」物理動態的模型。它能在無需手動建置環境的情況下,提供高度的環境多樣性與靈活性,實現「先思考、後行動」的預測與策略評估能力。
黃勝斌強調,Cosmos與Omniverse並非競爭關係,而是共同成長的互補技術。隨著物理模型的完善,Cosmos能處理高多樣性、大規模的資料生成與策略檢驗;而Omniverse則持續作為最高精度的物理檢定環境。
這兩者的結合,將有效解決了當前世界動作模型 (World Action Models) 在訓練資料生成上的巨大瓶頸。
機器人走入真實場域的四大應用觀察
針對機器人的實際應用場景與商業化落地,除了目前發展相對成熟的工業製造與倉儲物流外,黃勝斌也點出未來極具潛力的幾個關鍵領域:
•資料中心 (Data Centers):隨著AI運算需求爆發,資料中心的規模日益龐大,並且面臨嚴重的基礎維護人力短缺。若能導入機器人進行機房巡檢、甚至是硬體抽換作業,將能大幅提升資料中心的維運效率。
•醫療院所 (Hospitals):目前臨床護理人員有高達70%的時間,多半消耗在非臨床的行政與後勤雜務上 (如搬運物資、引導病患)。導入具備基礎導航與搬運能力的輔助機器人,將能有效釋放醫療量能,提升病患的照護品質。
•智慧家庭 (Home Robotics):這是環境變數最大的場域 (例如滿地散落的寵物玩具)。黃勝斌以
為例,強調家用機器人的設計不能只考量軟體,硬體本身的體積、重量與移動速度都直接牽涉到極高的人身安全風險。
建構機器人友善環境
另一方面,黃勝斌也認為建構機器人友善環境其實也相對重要,預期在應用場景要求機器人以具備極度精密、昂貴的機械手,仿照人類用手開啟傳統冰箱的行為,不如設法建立「對機器人友善的環境」 (Robot-friendly environment),例如透過物聯網連動,當機器人靠近冰箱時,在判斷其意圖後,即可自動將冰箱門開啟,方便機器人直接拿取冰箱中物品,使其省去設法先動手打開冰箱的步驟,進而加快協助完成工作任務。
透過環境與機器人的協同運作,而非一昧地追求讓機器人有更好運作精度表現,或許才是加速家用機器人普及更務實的作法。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

討論區