18+

Arm揭曉鎖定旗艦行動平台設計的Lumex運算子系統細節 導入SME2延伸指令集、全新運算叢集

▲Arm揭曉鎖定旗艦行動平台設計的Lumex運算子系統細節
▲Arm揭曉鎖定旗艦行動平台設計的Lumex運算子系統細節

先前宣布因應不同運算需求調整產品名稱,更清楚識別其對應運算場景之後,Arm 今日 (9/10)於上海舉辦的Unlock峰會活動進一步說明全新Arm Lumex運算子系統 (CSS)細節,其中包含導入全新SME2延伸指令 集,以及全新C1系列CPU與Mali G1-Ultra GPU。

Arm資深副總裁暨終端產品事業部總經理Chris Bergey表示,目前運算已經走向以AI 驅動為優先的發展模式,並且重新改寫過往運算架構,而此次提出的全新Arm Lumex運算子系統更是以AI優先 (AI First)為設計,並且整合運算效能 、電源效率與可擴展的系統設計,不僅在硬體 性能 大幅提升,更提高軟體整合與開發者支援效益,藉此簡化產品設計複雜度。

▲此次提出的全新Arm Lumex運算子系統更是以AI優先 (AI First)...
▲此次提出的全新Arm Lumex運算子系統更是以AI優先 (AI First)為設計,並且整合運算效能、電源效率與可擴展的系統設計

Arm Lumex實現個人化即時運算體驗

延續先前提出的Armv9指令集與Kleidi AI,以及藉由SME2延伸指令集 (Scalable Matrix Extension 2),強化其運算平台在行動裝置中的AI運算能力,Arm在此次公布具體細節的Lumex運算子系統加入全新C1系列CPU運算叢集,並且加入全新支援混合工作負載與硬體等級即時光追的Mali G1-Ultra GPU,藉此推動智慧型手機與行動裝置進入個人化AI使用體驗發展。

▲藉由SME2延伸指令集 (Scalable Matrix Extension ...
▲藉由SME2延伸指令集 (Scalable Matrix Extension 2),強化其運算平台在行動裝置中的AI運算能力

而此次更新的C1系列CPU運算叢集,分別包含定位旗艦的C1-Ultra、次旗艦應用的C1-Premium,以及講求運算性能與電力平衡的C1-Pro,另外也包含追求更極致能源效率的C1-Nano,並且全面對應SME2延伸指令集。

特性分別如下:

• C1-Ultra:鎖定旗艦峰值性能,標榜在單執行緒提升25%性能提升,以及每核心相比前一代產品提升雙位數性能,支援大型AI模型推論,並且對應運算攝影、內容創作、生成式AI等應用需求。

• C1-Premium:鎖定主流運算性能,相比C1-Ultra CPU設計約縮減35%面積,但是保留高性能輸出特性,預計用於次旗艦機種,或是語音助理、多工運算等使用需求。

• C1-Pro:鎖定穩定性能輸出特性,相比前一代產品可提升16%穩定性能表現,主要針對長時間影音內容播放、串流推論等應用場景打造。

• C1-Nano:鎖定極致省電使用特性,標榜能減少26%電力損耗,並且大幅減少佔用面積,主要鎖定穿戴裝置或超小型裝置。

▲此次更新的C1系列CPU運算叢集,分別包含定位旗艦的C1-Ultra、主流應用...
▲此次更新的C1系列CPU運算叢集,分別包含定位旗艦的C1-Ultra、主流應用的C1-Premium,以及講求運算性能與電力平衡的C1-Pro,另外也包含追求更極致能源效率的C1-Nano,並且全面對應SME2延伸指令集

實現桌機級別遊戲 體驗與更快的AI推論

全新的Arm Mali G1-Ultra GPU導入全新第二代光線追蹤 (Ray Tracing Unit v2, RTUv2)技術,可即時光照、陰影與反射效果大幅提升,相比前一代技術約提高2倍效率,並且讓手機端遊戲帶來逼真的主機級畫質。

另外,Mali G1-Ultra在AI工作負載更可將推論效能提升高達20%,並且強化各類即時應用的回應速度。

▲全新的Arm Mali G1-Ultra GPU導入全新第二代光線追蹤 (Ra...
▲全新的Arm Mali G1-Ultra GPU導入全新第二代光線追蹤 (Ray Tracing Unit v2, RTUv2)技術,可即時光照、陰影與反射效果大幅提升

在各類圖像基準測試中,Mali G1-Ultra相比前一代產品實現20%的效能提升,並且為《暗區突圍:無限》、《要塞英雄》、《原神》、《崩壞:星穹鐵道》等主流遊戲帶來全面的效能強化。

同時,Arm也宣布推出Mali G1-Premium與Mali G1-Pro兩款GPU,讓硬體資源受限的裝置也能獲得更出色的效能與能效表現。

開發者友善的裝置端AI解決方案

Arm標榜開發者可在Lumex平台上獲得立即可用的AI開發體驗,其中透過KleidiAI與各大主流框架整合,包括對應PyTorch ExecuTorch、Google LiteRT、阿里巴巴MNN及微軟ONNX Runtime等,開發者無需修改任何程式碼,即可自動取得SME2延伸指令集的加速能力。

▲Arm強調在Lumex運算子系統導入SME2延伸指令集,並且接續推動更龐大的人...
▲Arm強調在Lumex運算子系統導入SME2延伸指令集,並且接續推動更龐大的人工智慧運算

▲藉由Kelidi AI推動人工智慧運算應用服務發展,同時也攜手諸多業者合作導入...
▲藉由Kelidi AI推動人工智慧運算應用服務發展,同時也攜手諸多業者合作導入SME2延伸指令集

而對於需要建構跨平台 應用的開發者而言,Lumex更帶動全新的可移植性。例如包含Gmail、YouTube與Google Photos等Google應用服務已經全面支援SME2延伸指令集,並且可在Lumex平台設計裝置無縫運作。

另外,包含支付寶在內App也已經導入SME2延伸指令集設計,更多針對Android平台最佳化的功能,後續也能以無縫形式延伸至採用Arm架構的Windows PC或其他作業系統上使用。

▲SME2延伸指令集目前已經與Google、阿里巴巴、榮耀、三星、騰訊、網易、v...
▲SME2延伸指令集目前已經與Google、阿里巴巴、榮耀、三星、騰訊、網易、vivo、PyTorch等合作支援

AI時代的平台級智慧

Arm強調Lumex不僅是針對消費運算市場打造的最先進運算子系統,更是開啟新時代智慧 AI 體驗的基礎,並且能讓OEM廠商、開發者輕易打造應用產品或服務,進而在關鍵裝置端的應用場景實現兼具個人化、隱私保障且具高效能表現的AI體驗。

同時,Arm預期在2030年將會有超過30億台裝置搭載SME/SME2延伸指令集,並且新增超過100億TOPS運算效能。另一方面,Arm也說明目前SME2延伸指令集已經獲得Google、Meta、支付寶等平台業者驗證,並且將使語音辨識延遲改善超過4.7倍、經典大型語言模型任務執行效率可提升4.7倍,生成式AI處理速度更可提升2.8倍。

至於此次推出的Lumex運算子系統是建立在3nm製程最佳化的定案就緒 (Tapeout-ready)設計之下,但也強調會持續對應更進接的2nm製程技術,藉此協助更多業者快速打造處理器產品,並且縮短開發時間。

目前vivo已經透露將採用以Arm Lumex運算子系統打造的處理器,並且將用在下一代X系列旗艦手機,預期將是聯發科接下來預期揭曉的天璣9500,而vivo預計推出新款旗艦手機沒意外將是預計在10月對外揭曉的X300。

▲vivo、支付寶均說明將對應Arm SME2延伸指令集,同時vivo也透露接下...
▲vivo、支付寶均說明將對應Arm SME2延伸指令集,同時vivo也透露接下來將在即將推出的X系列旗艦手機導入Ar Lumex運算子系統設計處理器

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱