18+

DeepSeek殺出一片天!OpenAI執行長:持續當前AI研究、算力依然重要

對於中國人工智慧 新創DeepSeek 近期推出同名APP,在短時間內吸引大量用戶下載,其標榜開源使用的人工智慧模型「DeepSeek V3」性能超越Meta的Llama 3.1,更與Anthropic的Claude-3.5、OpenAI GPT-4o 性能相當,同時模型背後所需硬體算力更遠低於市場其他競爭對手,而開發成本甚至不到600萬美元,並且吸引市場關注的情況,OpenAI執行長 Sam Altman表示將持續聚焦當前研究路線,並且強調算力依然重要。

DeepSeek的横空出世,同時標榜能以不到600萬美元成本打造人工智慧模型,同時也強調其人工智慧僅需少許算力、費用即可運作,讓眾多科技業者聲稱人工智慧必須花費數千萬,甚至破億美元價格才能建造的說法變得尷尬,甚至也造成NVIDIA過去以來推崇以GPU作為訓練加速器的作法開始被質疑,導致NVIDIA等業者的股價受衝擊。

不過,Sam Altman稍早透過「X」發表看法,則認為DeepSeek的人工智慧模型表現確實令人有深刻印象,但也強調OpenAI將推出性能表現更好的人工智慧模型,同時更說明算力依然是人工智慧技術發展重要基礎。

而OpenAI研究副總裁陳信翰 (Mark Chen)也透過「X」指出DeepSeek透過數據最佳化方式控制執行成本,更暗示OpenAI也能以相同方式實現,甚至能以更大優勢降低成本,同時強調低成本運作模型不見得能有更高性能表現。

至於其他對於DeepSeek的看法,前Google執行長Eric Schmidt則認為DeepSeek的出現,意味中國業者能以更少資源與美國大型科技業者競爭,同時也呼籲美國擴大開源人工智慧模型發展力道,藉此在全球人工智慧技術競爭轉折點取得優勢,前Intel執行長Pat Gelsinger也在其對於DeepSeek的看法中提及開源重要性,更認為DeepSeek有助於重塑日漸封閉的人工智慧模型建置流程。

另一方面,不少看法也認為DeepSeek凸顯當前以數據最佳化、蒸餾處理過的小型人工智慧模型,在特定領域、條件下的運作性能堪比,甚至超越大型人工智慧模型的情況,使得更多業者更願意針對特定運算情境、需求打造更符合運算需求的小型人工智慧模型,另外也有看法指出DeepSeek創辦人梁文鋒最主要目的並非放在更長遠的發展目標,而是希望以此爭取更多投資機會。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

本日熱門 本周最熱 本月最熱