AI算力不只靠GPU！Meta擴大結盟AWS 佈署數千萬核Graviton晶片驅動代理式AI

2026-04-26 07:37

聯合新聞網／ 楊又肇

Meta 與AWS 稍早宣布達成一項重大協議：Meta將大規模佈署AWS自行研發的Graviton處理器，初期採用規模高達「數千萬個核心」，一舉成為全球最大的Graviton客戶之一。這項合作不僅延續了雙方的長期戰略夥伴關係，更凸顯隨著能自主規劃與執行任務的「代理式AI」 (Agentic AI)崛起，CPU密集型的工作負載正大幅攀升，而專為雲端打造的客製化晶片，將成為驅動新世代AI應用的關鍵引擎。

為何是CPU？代理式AI帶動運算架構轉型

過去幾年，生成式AI的發展高度依賴GPU進行龐大的矩陣運算與模型訓練。然而，隨著AI技術邁入下一個階段，越來越多企業開始導入代理式AI。這類系統不再只是被動回答問題，而是能夠自主推理、規劃步驟，甚至呼叫外部工具完成複雜任務。

Meta基礎設施主管Santosh Janardhan指出，代理式AI的工作負載 (包含即時推理、程式碼生成、資料搜尋，以及多步驟的任務協調，本質上屬於「CPU密集型運算」，意味這些工作需要極低延遲與高度邏輯協調能力，而這正是AWS Graviton處理器所擅長的領域。

Graviton5的硬體優勢：3nm製程與Nitro系統加持

為了應付Meta龐大的AI推理需求，AWS這次端出的硬體陣容極具競爭力。

• 頂尖規格與能效：最新一代的AWS Graviton5晶片採用先進的3nm製程，配備高達192個核心。與前一代相比，其快取記憶體容量大幅提升5倍，核心間的通訊延遲減少33%，整體效能提升達25%，對於需要持續推理、快速處理資料的代理式AI系統相當重要。

• 底層架構的最佳化：Graviton深度整合AWS獨家的Nitro系統。這套系統架構允許Meta直接存取裸機硬體 (Bare Metal)，並且透過Elastic Network Adapter (ENA)與EBS儲存裝置，在不犧牲效能的前提下無縫運行Meta自有虛擬機器。

• 跨節點的高速通訊：針對需要將大規模任務分配到眾多處理器上協調的代理工作流，Graviton5執行個體支援Elastic Fabric Adapter (EFA)，能實現伺服器節點之間極低延遲、高頻寬的數據通訊。

多元化運算資源成為戰略要務

Meta長期以來透過Amazon Bedrock來支援其新一代AI發展，如今進一步深耕底層硬體。正如Meta基礎設施主管所強調：「多元化運算資源是一項策略要務」。透過佈署數千萬個Graviton運算核心，Meta得以在控制成本與能源消耗的前提下，實現極具規模的AI基礎設施擴展。

而除了與AWS合作，實際上Meta在今年3月也宣布與Arm合作導入其首款自製伺服器處理器AGI CPU，主要藉由低功耗、高性能運算特性，擴大用於各類代理式AI，並且將其與Meta自研的AI加速晶片「MTIA」協同運作，藉此實現在大規模AI系統中更有效率的運算調度，而雙方也承諾將在未來多個世代的產品路線圖中持續深入合作。