在Computex 2024正式開始前,Arm宣布推出對應消費運算產品的運算子系統 (CSS),一樣整合Armv9指令集,並且完成3nm製程節點與全新Arm CPU、GPU設計驗證,同時更可對應下一代Cortex-X CPU設計,使其每周期指令效能 (IPC)能提升達36%,並且使Immortalis GPU顯示效能提升37%,另外也能藉由KleidiAI軟體驅動的人工智慧 框架加速提升運算效能。
在此之前,Arm主要針對資料中心應用的Neoverse CPU架構導入運算子系統設計,而此次將運算子系統設計導入消費運算產品,主要因應目前人工智慧運算成長趨勢,藉此讓消費端處理器效能能大幅提升,並且能配合人工智慧框架加速提升更高運算效能。
而藉由導入運算子系統設計,同時也能讓客戶增加更多客製化設計,並且加快運算產品進入市場腳步,藉此因應成長速度日漸增長的人工智慧技術發展需求。
至於此次加入運算子系統設計的消費運算產品,將對應Armv9.2版本指令集的CPU及Immortalis GPU,同時也完成3nm製程節點設計驗證,並且藉由新版Corelink系統連結各運算元件。
新設計除了讓CPU每周期指令效能提升達36%,並且使Immortalis GPU顯示效能提升37%,更藉由KleidiAI軟體驅動的人工智慧框架加速提升運算效能,讓整體人工智慧推論效能提升打59%,可對應未來將在裝置端更頻繁的人工智慧運算工作負載需求。
[caption id="attachment_198673" align="aligncenter" width="1200"] [/caption]
許多升級都是為了接下來的裝置端人工智慧運算需求
此次更新的Cortex-X925 CPU,將可藉由3nm製程實現3.8GHz運作時脈,並且對應更大快取記憶體設計,相較去年以4nm製程打造的旗艦處理器,不僅能達成36%幅度的每周期指令效能提升,在人工智慧運算效能更有41%提升幅度。
除此之外,包含新款在目標人工智慧與遊戲應用效能提升35%的Cortex-A725 CPU,以及更新後的Cortex-A520 CPU與DSU-120,搭配新版Armv9指令集之下,更讓此次推出的新CPU設計能發揮更高運算效能,同時也讓能源損耗降低。
Immortalis-G925 GPU更成為Arm有史以來顯示效能、能源使用效率最高的GPU設計,對應10核心起跳設計與即時光影追跡能力之餘,更能在人工智慧、機器學習運算提升34%效能,而此次也同步更新Mali-G725 GPU與Mali-G625 GPU,藉此對應更多不同處理器設計。
另外,Arm此次推出的KleidiAI軟體框架將用於推動人工智慧工作負載效能,同時也透過KleidiCV對應電腦視覺應用需求。其中,KleidiAI將能在Arm架構CPU以最佳化形式運作,並且對應NEON、SVE2及SME2等可擴展向量延伸指令集,另外也相容PyTorch、Tensorflow、MediaPipe、Llama 3等常見人工智慧運算框架,更可藉由相容特性支援日後推出的Arm架構產品,以利現有軟體能繼續用於未來推出處理器產品。
與諸多業者合作,但Qualcomm預期會以不同設計打造自主架構產品
宣布推出對應消費運算產品的運算子系統,並且更新主要CPU、GPU設計之餘,Arm也宣布與Intel代工業務、聯發科、三星、台積電等業者合作,而vivo也宣布將導入Arm全新運算產品設計,或許暗示下半年即將推出新機將會採用聯發科新款旗艦處理器天璣9400。
不過,由於Qualcomm先前已經宣布將在下一款旗艦處理器Snapdragon 8 Gen 4導入源自NUVIA的自主架構Oryon CPU設計,意味將不會全面 (或僅部分)採用Arm架構設計,因此在接下來的運算架構發展將不會特別受限於Arm提出設計,或許會有不一樣的運算效能表現。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》