Meta 與AWS 稍早宣布達成一項重大協議:Meta將大規模佈署AWS自行研發的Graviton處理器,初期採用規模高達「數千萬個核心」,一舉成為全球最大的Graviton客戶之一。這項合作不僅延續了雙方的長期戰略夥伴關係,更凸顯隨著能自主規劃與執行任務的「代理式AI」 (Agentic AI)崛起,CPU密集型的工作負載正大幅攀升,而專為雲端打造的客製化晶片 ,將成為驅動新世代AI應用的關鍵引擎。
為何是CPU?代理式AI帶動運算架構轉型
過去幾年,生成式AI的發展高度依賴GPU進行龐大的矩陣運算與模型訓練。然而,隨著AI技術邁入下一個階段,越來越多企業開始導入代理式AI。這類系統不再只是被動回答問題,而是能夠自主推理、規劃步驟,甚至呼叫外部工具完成複雜任務。
Meta基礎設施主管Santosh Janardhan指出,代理式AI的工作負載 (包含即時推理、程式碼生成、資料搜尋,以及多步驟的任務協調,本質上屬於「CPU密集型運算」,意味這些工作需要極低延遲與高度邏輯協調能力,而這正是AWS Graviton處理器所擅長的領域。
Graviton5的硬體優勢:3nm製程與Nitro系統加持
為了應付Meta龐大的AI推理需求,AWS這次端出的硬體陣容極具競爭力。
• 頂尖規格與能效:最新一代的AWS Graviton5晶片採用先進的3nm製程,配備高達192個核心。與前一代相比,其快取記憶體容量大幅提升5倍,核心間的通訊延遲減少33%,整體效能提升達25%,對於需要持續推理、快速處理資料的代理式AI系統相當重要。
• 底層架構的最佳化:Graviton深度整合AWS獨家的Nitro系統。這套系統架構允許Meta直接存取裸機硬體 (Bare Metal),並且透過Elastic Network Adapter (ENA)與EBS儲存裝置,在不犧牲效能的前提下無縫運行Meta自有虛擬機器。
• 跨節點的高速通訊:針對需要將大規模任務分配到眾多處理器上協調的代理工作流,Graviton5執行個體支援Elastic Fabric Adapter (EFA),能實現伺服器節點之間極低延遲、高頻寬的數據通訊。
多元化運算資源成為戰略要務
Meta長期以來透過Amazon Bedrock來支援其新一代AI發展,如今進一步深耕底層硬體。正如Meta基礎設施主管所強調:「多元化運算資源是一項策略要務」。透過佈署數千萬個Graviton運算核心,Meta得以在控制成本與能源消耗的前提下,實現極具規模的AI基礎設施擴展。
而除了與AWS合作,實際上Meta在今年3月也宣布與Arm合作導入其首款自製伺服器處理器AGI CPU,主要藉由低功耗、高性能運算特性,擴大用於各類代理式AI,並且將其與Meta自研的AI加速晶片「MTIA」協同運作,藉此實現在大規模AI系統中更有效率的運算調度,而雙方也承諾將在未來多個世代的產品路線圖中持續深入合作。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 vivo X300 Ultra手機開箱!實測增距鏡變身鳥類學家 拍得到101內部海報
📢 iPhone 18 Pro三大升級亮點曝!多項「歷代最佳」成換機大誘因
📢 LINE免費貼圖5款!毛小孩集合 快用「勸敗買買圖」慫恿朋友瞎拼
📢 Sony Xperia 1 VIII開箱!5亮點礦石機身+新望遠鏡頭 實測AI攝影助理聰明
📢 「旅遊eSIM」三大電信都可申請!整理日本漫遊方案差異一次看
📢 便宜資費懶人包/5G 399元比4G便宜 新方案「每月加100」上網升級

討論區