DeepSeek標榜低成本…半導體研究機構估：歷來硬體投資逾5億美元

2025-02-03 15:49

聯合報／記者賴錦宏／即時報導

半導體研究機構SemiAnalysis近日發表報告，估計DeepSeek歷來硬體投資支出高於5億美元。（路透資料照）

大陸人工智慧（AI ）新創公司「深度求索」（DeepSeek ），以僅約560萬美元及使用2048顆輝達（Nvidia）「H800」繪圖處理器（GPU），推出的新模型 DeepSeek-R1，由於成本遠低於美國科技巨擘，引發全球市場關注。不過，半導體 研究機構SemiAnalysis近日發表報告估計，DeepSeek歷來的硬體投資支出，應遠高於5億美元。

SemiAnalysis報告估計，DeepSeek使用5萬顆輝達Hopper架構GPU，包括1萬顆「H800」、1萬顆「H100」，還有特供大陸的「H20」，這些GPU主要用於AI訓練、研究及財務模型。換算下來，DeepSeek總資本支出約為16億美元，其中營運成本估計有9.44億美元，對GPU的投資額超過5億美元。

SemiAnalysis報告裡提到，2023年5月，大陸對沖基金「幻方量化」成立「深度求索」（DeepSeek），以推動AI技術研發，但早在2021年，幻方量化已在出口管制生效前，投資購買了1萬顆輝達（Nvidia）A100 GPU。

DeepSeek論文提到的近600萬美元成本，是指預訓練運行（pre-training run）的GPU成本，只占部分的模型總成本，不代表完整支出。另外未計入的重要支出，還包括研發（R&D）、硬體總擁有成本（Total Cost of Ownership）等關鍵因素。

同時，DeepSeek自大陸本土招募人才，目前約有150名員工，也正急速擴張中。

先前DeepSeek宣稱，使用6710億個參數進行訓練的「V3」模型，僅用2048顆輝達「H800」GPU、費時2個月訓練完成，相當於280萬個GPU小時。相較之下，Facebook母公司Meta Platforms使用4050億個參數訓練的「Llama 3」模型，其採用的超級電腦內建16384顆「H100」GPU、費時54天，等於後者花費的運算資源（3080萬個GPU小時），是V3的11倍。

📌 數位新聞搶鮮看！