18+

黃仁勳曝「算力依然是支撐人工智慧技術發展的真理」!NVIDIA已做好準備

▲NVIDIA在此次GTC 2025期間重申算力依然是支撐人工智慧技術發展的「真理」
▲NVIDIA在此次GTC 2025期間重申算力依然是支撐人工智慧技術發展的「真理」

在此次GTC 2025活動上,NVIDIA 執行長黃仁勳 除了強調Blackwell 架構設計的加速器產品已經全面投入生產,預計今年下半年就會進入市場應用,另一方面也重申在人工智慧 技術發展趨勢之下,算力推進依然相當重要,而NVIDIA也依舊會堅持先前提出的一年節奏 (One Year Rhythm)技術成長發展目標,因此不僅預計在2026年接續推出下一款Rubin顯示架構產品,更計畫在2028年推進以美國知名物理學家Richard Feynman命名的Feynman顯示架構。

Blackwell架構產品全面投入生產

雖然先前以Blackwell架構設計的加速器產品曾因設計缺陷導致延後出貨,但在後續與台積電合作解決問題後,黃仁勳表示目前Blackwell架構產品已經全面投入生產,並且將與諸多業者合作推出多款伺服器應用產品,同時也將與各家雲端供應商合作,而Blackwell架構產品也將應用在電信網路、邊緣運算,乃至於自駕車、機器人市場,藉此加速更多人工智慧技術應用發展。

▲目前GPU加速設計已經廣泛應用在諸多領域
▲目前GPU加速設計已經廣泛應用在諸多領域

▲Blackwell顯示架構產品全面投入生產,最快會在今年底進入市場佈署應用
▲Blackwell顯示架構產品全面投入生產,最快會在今年底進入市場佈署應用

除了強調Blackwell架構產品全面投入量產,黃仁勳也說明即便人工智慧技術加快運算執行效率,但在運算本質上仍需以算力支撐,意味背後的運算技術堆疊依然有其必要性。

黃仁勳以大型自然語言模型推論婚宴上的不同嘉賓座位安排為例,雖然目前多數的大型自然語言模型可以在很少的詞元吞吐過程得出答案,但給出結果可能無法符合需求,或是根本給出錯誤答案。

如果要讓大型自然語言模型依照不同賓客關係、需求,在座位安排上做到最佳調整,在推論過程不可避免地必須用到更多詞元進行更深層的推論,運算次數也相對會增加許多。而此時如果希望運算速率、反應時間可以加快的話,背後必然需要堆疊更多算力,而非僅只是仰賴人工智慧運算。

▲以婚宴上的賓客座位安排為例,如果要讓人工智慧以深思熟慮形式推理運算,過程中必須...
▲以婚宴上的賓客座位安排為例,如果要讓人工智慧以深思熟慮形式推理運算,過程中必須產生超過20倍的詞元量,並且需要花費150倍以上的算力

算力堆疊依然有其必要性,而且將持續擴大

在進一步說明中,黃仁勳表示人工智慧發展重點包含「認知」與「推論」,前者在於如何知曉、理解所「獲取」資訊,並且由後者進行分析、思考得出合理解答,而目前的人工智慧技術在將使用者下達指令轉為詞元進行輸入後,在執行過程會持續產生更多詞元,並且於後續推論過程再以這些詞元進行輸入,經過多次反覆推論過程得出最合適解答。

這樣的流程中,意味要能「深思熟慮」得出合理推論解答的人工智慧,其運算過程必須處理更大量的詞元,而為了處理大量詞元,必須花費更高算力資源,甚至如果要能更快讓人工智慧得出解答,算力必須更進一步堆疊。

而縱使NVIDIA提出能讓人工智慧加速運算的開源推論軟體NVIDIA Dynamo,並且能使整體人工智慧運算成本降低,但從長遠發展來看,人工智慧技術背後的算力需求依然會以倍數成長,甚至會有更龐大的算力需求產生。

▲此次提出的開源推論軟體NVIDIA Dynamo,主要是針對既有人工智慧運算進...
▲此次提出的開源推論軟體NVIDIA Dynamo,主要是針對既有人工智慧運算進行最佳化,但實際提升幅度依然有限,主要還是仰賴後續算力堆疊

▲依照NVIDIA的作法,針對機器人的運作可以透過不同人工智慧運作方式加快其工作...
▲依照NVIDIA的作法,針對機器人的運作可以透過不同人工智慧運作方式加快其工作執行流暢度,並且提升其運作判斷正確度,例如在開源提供的Issac GR00T N1便是透過直覺運算的系統讓機器人可以直覺反應動作,並且透過另一組深思熟慮系統進行更完整的任務推論,藉此讓機器人在提升動作流暢度之餘,同時也能讓工作判斷更為正確

因此,黃仁勳在GTC 2025主題演講中表示,雖然Hopper顯示架構的加速器設計才剛問世幾年,但在當前算力成長需求的趨勢下,目前能給予他的評價已經不多,因為接下來的發展已經要從當前的Blackwell進展到接下來的Rubin,甚至也即將跨入到下一代的Feynman顯示架構。

若以Hopper顯示架構的算力表現為標準,Blackwell顯示架構的算力約成長68倍,而接下來的Rubin則有高達900倍的成長差距,同時若以Hopper作為每次運算成本的標準,則可以發現Blackwell在相同效能所需花費成本僅有Hopper的0.13倍,Rubin更僅有Hopper的0.03倍,意味在相同開銷之下,Blackwell、Rubin 所能推動算力更高。

▲Hopper推出時已經有相當不錯的算力表現,但目前進入Blackwell發展階...
▲Hopper推出時已經有相當不錯的算力表現,但目前進入Blackwell發展階段,則是將算力以擴展方式大幅提升

▲接下來將推出的Rubin將有更高算力提升
▲接下來將推出的Rubin將有更高算力提升

▲NVIDIA預期Rubin將能帶動更大規模的人工智慧加速運算
▲NVIDIA預期Rubin將能帶動更大規模的人工智慧加速運算

持續提供充足算力產品

相較去年將更多重點放在Blackwell顯示架構深度說明,此次GTC 2025有更多重心則是放在擴大Balckwell顯示架構應用生態,同時也說明Blackwell架構產品已經順利進入量產,預計今年下半年就會陸續進入市場佈署應用。

另一方面,NVIDIA也強調即使在人工智慧技術發展成長趨勢下,背後算力堆疊才是實際「真理」,即便藉由軟體、模型框架等方式進行最佳化,實際提升幅度依然有限。而在這些算力需求之下,NVIDIA持續提供充足算力產品,並且將以完整的產品藍圖規劃推進算力成長。

▲此次公布內容中,NVIDIA也與台積電等供應鏈合作推出共同封裝光學 (CPO)...
▲此次公布內容中,NVIDIA也與台積電等供應鏈合作推出共同封裝光學 (CPO)設計的網路交換器,藉此改善資料密集網路中日益增長的頻寬密度、通訊延遲、銅線傳輸距離限制,以及能源效率等問題

▲目前NVIDIA已經針對不同運算場景提供以GPU加速運算資源
▲目前NVIDIA已經針對不同運算場景提供以GPU加速運算資源

▲機器人預期是接下來更多業者競爭市場,而NVIDIA也同樣針對此需求提供加速運算...
▲機器人預期是接下來更多業者競爭市場,而NVIDIA也同樣針對此需求提供加速運算技術

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱