18+

AI算力不只靠GPU!Meta擴大結盟AWS 佈署數千萬核Graviton晶片驅動代理式AI

MetaAWS 稍早宣布達成一項重大協議:Meta將大規模佈署AWS自行研發的Graviton處理器,初期採用規模高達「數千萬個核心」,一舉成為全球最大的Graviton客戶之一。這項合作不僅延續了雙方的長期戰略夥伴關係,更凸顯隨著能自主規劃與執行任務的「代理式AI」 (Agentic AI)崛起,CPU密集型的工作負載正大幅攀升,而專為雲端打造的客製化晶片 ,將成為驅動新世代AI應用的關鍵引擎。

為何是CPU?代理式AI帶動運算架構轉型

過去幾年,生成式AI的發展高度依賴GPU進行龐大的矩陣運算與模型訓練。然而,隨著AI技術邁入下一個階段,越來越多企業開始導入代理式AI。這類系統不再只是被動回答問題,而是能夠自主推理、規劃步驟,甚至呼叫外部工具完成複雜任務。

Meta基礎設施主管Santosh Janardhan指出,代理式AI的工作負載 (包含即時推理、程式碼生成、資料搜尋,以及多步驟的任務協調,本質上屬於「CPU密集型運算」,意味這些工作需要極低延遲與高度邏輯協調能力,而這正是AWS Graviton處理器所擅長的領域。

Graviton5的硬體優勢:3nm製程與Nitro系統加持

為了應付Meta龐大的AI推理需求,AWS這次端出的硬體陣容極具競爭力。

• 頂尖規格與能效:最新一代的AWS Graviton5晶片採用先進的3nm製程,配備高達192個核心。與前一代相比,其快取記憶體容量大幅提升5倍,核心間的通訊延遲減少33%,整體效能提升達25%,對於需要持續推理、快速處理資料的代理式AI系統相當重要。

• 底層架構的最佳化:Graviton深度整合AWS獨家的Nitro系統。這套系統架構允許Meta直接存取裸機硬體 (Bare Metal),並且透過Elastic Network Adapter (ENA)與EBS儲存裝置,在不犧牲效能的前提下無縫運行Meta自有虛擬機器。

• 跨節點的高速通訊:針對需要將大規模任務分配到眾多處理器上協調的代理工作流,Graviton5執行個體支援Elastic Fabric Adapter (EFA),能實現伺服器節點之間極低延遲、高頻寬的數據通訊。

多元化運算資源成為戰略要務

Meta長期以來透過Amazon Bedrock來支援其新一代AI發展,如今進一步深耕底層硬體。正如Meta基礎設施主管所強調:「多元化運算資源是一項策略要務」。透過佈署數千萬個Graviton運算核心,Meta得以在控制成本與能源消耗的前提下,實現極具規模的AI基礎設施擴展。

而除了與AWS合作,實際上Meta在今年3月也宣布與Arm合作導入其首款自製伺服器處理器AGI CPU,主要藉由低功耗、高性能運算特性,擴大用於各類代理式AI,並且將其與Meta自研的AI加速晶片「MTIA」協同運作,藉此實現在大規模AI系統中更有效率的運算調度,而雙方也承諾將在未來多個世代的產品路線圖中持續深入合作。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱