大陸新創企業深度求索公佈低成本大模型後,除夕(1月28日)再發布開源文字生成圖像(文生圖)大模型Janus-Pro 7B,該模型在基準測試中超越美國巨頭OpenAI 。
綜合路透社報導和GitHub消息,這款開源多模態模型被設計為高效且多功能的模型,擅長生成逼真圖像、執行複雜視覺推理等多種視覺任務。
深度求索自稱,Janus-Pro在使用文本提示生成圖像的基準測試中,表現優於OpenAI的DALL-E 3和Stability AI的Stable Diffusion。
深度求索公眾號說,這款大模型是2024年11月13日發布的JanusFlow大模型的進階版本。新模型通過改進訓練流程、數據質量和模型規模,提升圖像生成的穩定性和細節表現。
深度求索解釋道,Janus-Pro通過增加7200萬張高質量的合成圖像,並與真實數據進行平衡,進一步提高視覺效果的吸引力和圖像輸出的穩定性;新款模型版本擁有高達70億個參數,在文本生成圖像的速度和準確性及任務理解能力方面取得顯著提升。
深度求索1月20日發布開源大語言模型DeepSeek -R1,憑藉低訓練成本,卻能比擬OpenAI的o1模型的高效能引發全球科技圈關注,更促使投資者拋售全球科技股。此舉沖擊美股,輝達市值蒸發近6000億美元。
美國科技博客網站VentureBeat報導指出,與一些規模最大、資源最密集的模型不同,擁有70億參數的Janus-Pro無需龐大的計算資源即可提供高水平的性能,這可能大大降低企業採用先進視覺AI的門檻,對初創公司或跨國企業來說具有極大吸引力。
此外,在Janus-Pro模型的開源性質下,企業無需受限於供應商綁定或支付高額費用,就能使用前沿AI技術。這對AI巨頭構成直接威脅:他們的專有高價模型能否在免費、高質量的替代品面前生存?市場的拋售表明投資者對此表示懷疑。
VentureBeat認為,深度求索選擇在美國科技股暴跌之際發布Janus-Pro,這一時機顯然經過精心設計,意在突顯這家初創企業對矽谷的挑戰,且具備顛覆AI領域既有秩序的能力。
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 鳳凰颱風走到哪裡了?看颱風最新動態、即時路徑 6平台吸千人24小時報現況
📢 日本西瓜卡升級新功能!儲值上限變30萬日圓、吉祥物Suica企鵝2026下台告別
📢 iPhone 20告別瀏海與挖孔!蘋果首款全螢幕無開孔手機長這樣
📢 懶人包/普發一萬領現金最安心!指定ATM去哪找?LINE一鍵查詢領錢管道
📢 三星Galaxy S26+渲染圖外觀曝光!旗艦機Galaxy S26 Ultra自拍能塞更多人
📢 蘋果HomePod mini 2「推出機率更高」!零售商「停產」洩密 新品功能曝光

登(加)入 udn 會員不只享專屬優惠,現在再送 LINE POINTS 5 點!即日起至 11/20,不論新朋友或老朋友,輕鬆加入就有獎 ( 每日限量 1,000 組,不定時放送 ),馬上入手點數,讓生活多一點開心回饋。