為什麼推出「Grace」CPU 對於NVIDIA而言至關重要?
今年維持以線上形式舉辦的GTC 2021期間,NVIDIA正式揭曉以Arm架構打造的「Grace」CPU,並且宣布擴展Arm在智慧型手機以外的市場生態規模。而為什麼在此時推出「Grace」CPU,對於NVIDIA而言會是至關重要?
「Grace」CPU不是用來取代現有x86架構CPU
簡單回顧一下「Grace」CPU的設計,本身是以台積電5nm製程打造,並且以美國知名女性電腦科學家,同時也是當時美國海軍准將身分的Grace Hopper為稱,設計上則採用Arm Nerverse架構。
實際上,關於「Grace」CPU的深入細節,NVIDIA在此次GTC 2021並未進一步說明,僅透露採用對應Arm新版指令集與全新核心設計。而在NVIDIA釋出設計圖像中,「Grace」CPU是以MCM (Multi-Chip Module,多晶片模組)形式與NVIDIA據說是下一款GPU封裝於單一板模,同時也整合對應CPU使用的LPDDR5X ECC記憶體模組,以及提供GPU使用的顯示記憶體,至於對於下一款GPU的相關細節,目前NVIDIA也未多作說明。
不過,NVIDIA說明中詮釋一個重要想法,就是依然認為縱使GPU運算效能再強大,依然需要配合CPU協助處理資料存取、執行指令集,GPU本身定位依然是作為運算加速用途,因此在對外說明時仍強調會繼續維持與x86、Power架構設計處理器維持合作,意味就算推出「Grace」CPU,與Intel、AMD及IBM等處理器業者合作關係並不會改變。
並非NVIDIA第一款CPU,亦非第一款Arm架構產品
而「Grace」CPU實際上也並非NVIDIA第一款以Arm架構打造的CPU產品,早在之前就已經推出多款Tegra處理器,甚至也曾應用在手機、機上盒等產品,只是後來考量競爭優勢與公司業務發展方向轉型,因此Tegra處理器後續便轉往自動化應用、車載平台設計發展為主。
此次推出「Grace」CPU的用意,實際上是針對人工智慧與超算使用需求打造,其中又以打通GPU藉由CPU存取系統記憶體設計,藉此改善過往x86架構CPU受限PCIe頻寬情況,讓GPU處理大量運算資料時,可直接借助系統記憶體資源大幅提高資料運算處理效率。
為了讓更多CPU資源可用於資料處理上,NVIDIA甚至在設計上整合旗下Bluefield DPU設計,以子系統形式協助處理原本由CPU執行的I/O埠控管、資料傳輸安全等需求,避免佔用CPU運算資源。
NVLink技術無法突破的障礙
對NVIDIA持續關注的人應該會提出質疑,先前明明已經提出NVLink的技術,讓GPU之間可以透過串接共享更大顯示記憶體資源,甚至也能用於GPU與CPU之間溝通,但問題就在於顯示記憶體價格成本明顯比系統記憶體昂貴許多,而GPU與CPU之間藉由NVLink技術溝通,實際上也要看x86架構CPU業者是否願意與NVIDIA進行此方面合作。
例如,Intel本身就提出CXL開放架構推動伺服器超算能力,而AMD方面也提出智慧存取記憶體 (Smart Access Memory)技術,藉此消除受限PCIe頻寬的數據傳輸效率,藉此提高CPU與GPU之間溝通運算效能。
雖然過去IBM曾與NVIDIA合作,透過NVLink進行GPU與CPU之間溝通,藉此加快資料加速處理效率,但以整體超算伺服器市場仍以x86架構CPU主導情況來看,顯然僅與IBM合作依然不夠,因此藉由Arm架構打造「Grace」CPU,進而凸顯將Arm架構應用在人工智慧運算及超算領域確實有其發展機會,不僅能進一步推動Arm架構超算應用發展,同時也會吸引更多伺服器業者開始考慮投入Arm架構應用佈局,進而擴大Arm架構在智慧型手機、嵌入式應用以外市場發展。
「Grace」CPU對於NVIDIA至關重要
依照NVIDIA執行長黃仁勳在後續受訪時表示,推出「Grace」CPU的用意,絕對不是為了取代原本合作許久的x86架構CPU,同時未來也沒有打算僅以Arm架構CPU投入發展,強調「Grace」CPU是為了補足現行x86架構CPU無法滿足的巨量數據傳輸處理效率需求。
而「Grace」CPU的設計,對於NVIDIA至關重要的原因,則是增加自有人工智慧、超算等級CPU產品製作能力,無須完全受限於Intel、AMD合作關係,在伺服器應用發展更是多了話語權,不再只是以GPU加速應用立場自居,更能提供完整人工智慧及超算伺服器設計應用方案。
此外,藉由Arm架構打造「Grace」CPU,並且持續與Arm合作讓後續推出的Armv9指令集也能對應CUDA及CUDA-X指令集,因此未來或許也能看見更多Arm架構CPU搭配NVIDIA GPU的組合應用,例如強調未來將使旗下Mac機種全數轉換為Arm架構處理器設計的蘋果,或許未來也有機會藉此恢復與NVIDIA合作。
關於「Grace」CPU的名稱
依照NVIDIA說明,「Grace」CPU最快會在2023年進入市場應用,預期會在2022年推出Ampere顯示架構下一款產品,以及Nluefield-3 DPU,此後將維持每年都會有新產品問世的更新頻率,並且以GPU、DPU與CPU產品交錯方式更新。
不過,相較過往產品都是以科學家的姓 (last name)作為代號,例如Fermi、Kepler、Maxwell、Pascal、Turing、Ampere,此次公布的「Grace」CPU,卻是以名 (first name)作為代號,或許NVIDIA計畫在鎖定超算領域的CPU產品將以科學家的名作為代號,而在Ampere顯示架構之後的代號,有可能就是先前傳聞許久的「Hopper」。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
留言