依靠AI做決定?專家實測6大AI工具可靠度 冠軍不是ChatGPT、Gemini
現在的人越來越習慣使用AI幫助自己做決定,不論是ChatGPT、Gemini還是Copilot,你是否有考慮過他們的可靠性是多少?
英國消費者組織「Which?」測試了ChatGPT、Google Gemini、Gemini AI Overview(AIO)、微軟Copilot、Meta AI和Perplexity等6款AI工具,向它們提出旅遊建議、消費者權益、健康與飲食等消費者常提問題,並從準確性、相關性、清晰度、實用性與倫理責任等方面進行打分。
哪款AI最可靠?
根據「Which?」的測試,知名度較低的Perplexity居然分數最高,有71%。大家最常用的Meta AI表現最差,僅有55%。而大家最常用的ChatGPT與Google Gemini分別獲得64%與69%。
AI的回答為何不可靠?
「Which?」發現,AI的回答有時來源不明,有時還會引用不可靠的來源。比如有時AI會引用Reddit等網路論壇的留言作為依據,但不考慮其是否過時。
此外,AI有時也會錯誤理解其引用的信息,或是無法辨別出用戶提問中存在的錯誤,導致其在消費者權益、理財、醫療等方面會給出錯誤的建議。
而「Which?」也進行調查,發現有47%的受訪者「非常」或「相當」信任 AI 的資訊,並有19%的受訪者依賴AI的醫療建議、17%的受訪者依賴AI的理財建議。這難免令人擔憂。
「Which?」也建議,使用AI時一定要清楚描述你的問題,並檢查AI的訊息來源。醫療、理財或法律問題,還是尋求專業人士的建議比較好。
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 小米Tag開箱!拚當平替版AirTag 2 實測4大功能高CP
📢 iPhone Fold不是傳聞「真的生產中」!最終手機渲染圖曝光 果粉好兩難
📢 三星爆有4款新摺疊機!神祕新機型號現身 傳為平價Galaxy Z Fold8 FE
📢 Insta360 Snap手機自拍螢幕開箱!實測磁吸手機主鏡頭取景超讚
📢 iPhone鬧鐘又罷工!苦主看著它跳出來聲音卻不響 2方法解決
📢 安卓跳槽愛瘋「用到懷疑人生」!2功能超難戒 內行反推蘋果最大優勢