
對於中國人工智慧 新創DeepSeek 近期推出同名APP,在短時間內吸引大量用戶下載,其標榜開源使用的人工智慧模型「DeepSeek V3」性能超越Meta的Llama 3.1,更與Anthropic的Claude-3.5、OpenAI 的GPT-4o 性能相當,同時模型背後所需硬體算力更遠低於市場其他競爭對手,而開發成本甚至不到600萬美元,並且吸引市場關注的情況,OpenAI執行長 Sam Altman表示將持續聚焦當前研究路線,並且強調算力依然重要。
DeepSeek的横空出世,同時標榜能以不到600萬美元成本打造人工智慧模型,同時也強調其人工智慧僅需少許算力、費用即可運作,讓眾多科技業者聲稱人工智慧必須花費數千萬,甚至破億美元價格才能建造的說法變得尷尬,甚至也造成NVIDIA過去以來推崇以GPU作為訓練加速器的作法開始被質疑,導致NVIDIA等業者的股價受衝擊。
不過,Sam Altman稍早透過「X」發表看法,則認為DeepSeek的人工智慧模型表現確實令人有深刻印象,但也強調OpenAI將推出性能表現更好的人工智慧模型,同時更說明算力依然是人工智慧技術發展重要基礎。
deepseek's r1 is an impressive model, particularly around what they're able to deliver for the price.
— Sam Altman (@sama) January 28, 2025
we will obviously deliver much better models and also it's legit invigorating to have a new competitor! we will pull up some releases.
而OpenAI研究副總裁陳信翰 (Mark Chen)也透過「X」指出DeepSeek透過數據最佳化方式控制執行成本,更暗示OpenAI也能以相同方式實現,甚至能以更大優勢降低成本,同時強調低成本運作模型不見得能有更高性能表現。
Congrats to DeepSeek on producing an o1-level reasoning model! Their research paper demonstrates that they’ve independently found some of the core ideas that we did on our way to o1.
— Mark Chen (@markchen90) January 28, 2025
至於其他對於DeepSeek的看法,前Google執行長Eric Schmidt則認為DeepSeek的出現,意味中國業者能以更少資源與美國大型科技業者競爭,同時也呼籲美國擴大開源人工智慧模型發展力道,藉此在全球人工智慧技術競爭轉折點取得優勢,前Intel執行長Pat Gelsinger也在其對於DeepSeek的看法中提及開源重要性,更認為DeepSeek有助於重塑日漸封閉的人工智慧模型建置流程。
另一方面,不少看法也認為DeepSeek凸顯當前以數據最佳化、蒸餾處理過的小型人工智慧模型,在特定領域、條件下的運作性能堪比,甚至超越大型人工智慧模型的情況,使得更多業者更願意針對特定運算情境、需求打造更符合運算需求的小型人工智慧模型,另外也有看法指出DeepSeek創辦人梁文鋒最主要目的並非放在更長遠的發展目標,而是希望以此爭取更多投資機會。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 蘋果iPad mini 7開箱!實測配PS5手把變遊戲主機、寫筆記 8.3吋螢幕超剛好
📢 任天堂Switch 2台灣快開賣?網揪「這處有檔期」時間曝光:我先空出來了
📢 北捷常客優惠縮水!3月1日起7折變85折新規則曝 TPASS 2.0還有額外回饋
📢 2月4G、5G便宜資費懶人包/4G不限速吃到飽免500!5G上網優惠只要399
📢 ChatGPT Search全面開放免費用!搜尋方法教學 3大招做預設搜尋引擎
📢 2025年最新!日本家電折價券最高18%折扣 7家電器店一次收藏