18+

耐能發表全球首款終端Mamba架構NPU 將轉型AI基礎建設公司

AI 晶片 新創耐能 (Kneron) 今日 (11/26)發表包含旗艦產品KL1140在內新一代AI系列晶片,並且由創辦人暨執行長劉峻誠博士揭示其未來三年的完整產品藍圖,更象徵耐能正式完成從低階到高階的全算力佈局,宣告從單純的晶片供應商,進化為全方位的「AI基礎建設公司」 (AI Infrastructure Company)。

KL1140:終端完整執行Mamba架構,打破雲端依賴

此次發表的旗艦KL1140,號稱是全球首款能在終端設備上完整運行Mamba神經網路架構 ()的邊緣AI晶片。Mamba架構近期在AI領域備受關注,被視為能與Transformer架構分庭抗衡的新星。

耐能強調,KL1140在能效上達到現有雲端方案的3倍,成本 更大幅下降10倍。透過4顆KL1140並聯,即可支援運行高達1200億組參數規模的大型語言模型 (LLM),同時功耗僅為傳統GPU的1/3,意味大型語言模型將不再需要依賴昂貴且高延遲的雲端GPU運作,並且能真正落地於智慧終端裝置。

註:Mamba神經網路架構由卡內基梅隆大學和普林斯頓大學的研究人員提出、開發,是一種用於序列建模任務、基於結構化狀態空間序列 (S4)模型的深度學習架構,可用於解決目前用於多數AI運算的Transformer架構使用局限性,尤其是在處理長序列方面,能夠處理不規則採樣的資料和長上下文,並且在訓練和推理期間維持運算執行效率。

三年藍圖曝光:涵蓋安防、通用視覺與Gen AI

劉峻誠博士也在會中首度公開了耐能未來三年的晶片規劃,涵蓋高中低階全線產品:

低功耗安防 (KL640 / KL650):主打全時常開能力,鎖定影像安防與低耗能場景。

高性價比通用視覺 (KL540 / KL515):針對網路攝影機 (IPCam)、機器視覺等大眾化終端設備。

新世代Gen AI專用 (KL840 / KL1150):針對高階智慧設備、車載與企業邊緣伺服器 打造,具備更高算力與串接能力。

KNEO 350邊緣伺服器與KNEO Pi平台 亮相

除了晶片本身,耐能也展示了完整的生態系佈局,包含新一代邊緣AI伺服器KNEO 350,以及累積全球28000名開發者的KNEO Pi開發平台。

耐能指出,現行AI運算模式面臨高成本、高能耗與資料隱私風險。透過KL1140及新系列晶片,耐能將推動「邊緣即未來」 (The Future Lives at the Edge)的發展願景,讓智慧安防機器人、車載系統與企業私有AI助理等應用,能在不依賴雲端連線的情況下即時運作,確保敏感資料留於本地。

目前耐能已經與Qualcomm、韓華、Toyota (豐田)、廣達、Sony等國際企業展開合作,並且將解決方案部署於醫療、教育及政府單位的主權AI專案中。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱