日前推出加強邏輯推理的人工智慧 模型「QwQ-32B-Preview」,阿里巴巴 稍早宣布推出加入視覺推論能力的人工智慧模型「QVQ-72B-Preview」,並且強調在語言理解與視覺推論有大幅進展,標榜能解決複雜問題。
「QVQ-72B-Preview」除了在參數數量規模增加至720億組,更加入影像識別能力,配合大型自然語言模型的理解分析能力,透過前後文理解推論與視覺分析,進而推理解決複雜問題的方法。
阿里巴巴表示,「QVQ-72B-Preview」將可用於大型家具於空間模擬放置,或是用於醫療影像分析診斷。同時,「QVQ-72B-Preview」在MathVista、MathVision、OlympiadBench的數學即可學基準測試取得優異表現,更在MathVision效能表現貼近OpenAI推出的o1人工智慧模型。
不過,由於目前仍處於預覽階段,因此「QVQ-72B-Preview」在執行運作時可能會出現遞歸推理循環情況,同時在混用不同語言情況下也會增加其執行反應時間。
目前「QVQ-72B-Preview」已經透過Hugging Face平台託管,以開源形式提供所有人取用。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 不買iPhone 17 Pro!iPhone 18 Pro手機「2大改版願望」蘋果聽到了
📢 學生做筆記挑iPad還是三星平板?網狂推這品牌:書寫體驗極佳
📢 日本西瓜卡升級新功能!儲值上限變30萬日圓、吉祥物Suica企鵝2026下台告別
📢 Nothing Ear (3)無線耳機開箱!透明充電盒變麥克風 實測拍片很適合
📢 LINE免費貼圖!《魔法壞女巫》超Q用半年、購物失心瘋專用圖案在這
📢 Pixel Watch 4開箱!12490元起、實測睡眠追蹤驚豔 Gemini抬手輕鬆對話

登(加)入 udn 會員不只享專屬優惠,現在再送 LINE POINTS 5 點!即日起至 11/20,不論新朋友或老朋友,輕鬆加入就有獎,馬上入手點數,讓生活多一點開心回饋。