
對於中國人工智慧 新創DeepSeek 近期推出同名APP,在短時間內吸引大量用戶下載,其標榜開源使用的人工智慧模型「DeepSeek V3」性能超越Meta的Llama 3.1,更與Anthropic的Claude-3.5、OpenAI 的GPT-4o 性能相當,同時模型背後所需硬體算力更遠低於市場其他競爭對手,而開發成本甚至不到600萬美元,並且吸引市場關注的情況,OpenAI執行長 Sam Altman表示將持續聚焦當前研究路線,並且強調算力依然重要。
DeepSeek的横空出世,同時標榜能以不到600萬美元成本打造人工智慧模型,同時也強調其人工智慧僅需少許算力、費用即可運作,讓眾多科技業者聲稱人工智慧必須花費數千萬,甚至破億美元價格才能建造的說法變得尷尬,甚至也造成NVIDIA過去以來推崇以GPU作為訓練加速器的作法開始被質疑,導致NVIDIA等業者的股價受衝擊。
不過,Sam Altman稍早透過「X」發表看法,則認為DeepSeek的人工智慧模型表現確實令人有深刻印象,但也強調OpenAI將推出性能表現更好的人工智慧模型,同時更說明算力依然是人工智慧技術發展重要基礎。
deepseek's r1 is an impressive model, particularly around what they're able to deliver for the price.
— Sam Altman (@sama) January 28, 2025
we will obviously deliver much better models and also it's legit invigorating to have a new competitor! we will pull up some releases.
而OpenAI研究副總裁陳信翰 (Mark Chen)也透過「X」指出DeepSeek透過數據最佳化方式控制執行成本,更暗示OpenAI也能以相同方式實現,甚至能以更大優勢降低成本,同時強調低成本運作模型不見得能有更高性能表現。
Congrats to DeepSeek on producing an o1-level reasoning model! Their research paper demonstrates that they’ve independently found some of the core ideas that we did on our way to o1.
— Mark Chen (@markchen90) January 28, 2025
至於其他對於DeepSeek的看法,前Google執行長Eric Schmidt則認為DeepSeek的出現,意味中國業者能以更少資源與美國大型科技業者競爭,同時也呼籲美國擴大開源人工智慧模型發展力道,藉此在全球人工智慧技術競爭轉折點取得優勢,前Intel執行長Pat Gelsinger也在其對於DeepSeek的看法中提及開源重要性,更認為DeepSeek有助於重塑日漸封閉的人工智慧模型建置流程。
另一方面,不少看法也認為DeepSeek凸顯當前以數據最佳化、蒸餾處理過的小型人工智慧模型,在特定領域、條件下的運作性能堪比,甚至超越大型人工智慧模型的情況,使得更多業者更願意針對特定運算情境、需求打造更符合運算需求的小型人工智慧模型,另外也有看法指出DeepSeek創辦人梁文鋒最主要目的並非放在更長遠的發展目標,而是希望以此爭取更多投資機會。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 「找車位神器」3秒搜出停車格!5縣市可用 駕駛實測嘆:相見恨晚
📢網紅「小周牙醫」歧視同志言論挨轟!道歉被網抓包IG、YT秒做1事:沒誠意
📢 Switch 2台北體驗會7/5登場!抽選制、超詳細報名規則曝
📢 ASUS VivoWatch 6 AERO智慧手環開箱!指尖量心電圖 睡眠追蹤曝「9成全淺眠」
📢 YouTube會員台灣便宜雙人方案來了!價格比印度貴近4倍 規則一次看
📢 獨/等到iPhone嗶進站!蘋果iOS18.4開放台灣NFC交易 悠遊卡公司回應了