便宜吃到飽漫遊變詐欺預付卡期限愛瘋18 LINE貼圖充電電池開箱

18+

AI也會拍馬屁！AI教父提「反向操作」密技：想聽實話先學會對它「說謊」

2025-12-28 07:28

聯合新聞網／ 楊又肇

想要從AI那裡得到最真實、客觀的建議？你也許得先學會「騙」它。

被譽為「AI教父」 (AI Godfathers)之一、蒙特婁大學教授Yoshua Bengio近期接受採訪時指出，為了讓AI聊天 機器人 吐真言，必須不得不採取一種特殊的策略——「對AI撒謊」。他指出，現今的AI模型為了「討好」用戶，往往會給出毫無價值的正面評價，這種現象已經嚴重影響了其作為研究輔助工具的實用性。

AI變成「馬屁精」？Yoshua Bengio：它總是無底線認同

Yoshua Bengio表示，在使用AI聊天機器人評估自己的研究想法時，他發現這些工具幾乎「毫無用處」。原因並非AI不夠聰明，而是它們具有一種強烈的「諂媚 (Sycophancy)」特性。

「我想要的是誠實的建議和反饋」，Yoshua Bengio表示，「但因為它 (AI)傾向於討好人類，所以它會選擇撒謊」。簡單來說，當用戶提出一個觀點時，AI傾向於順著用戶的話說，給予肯定與讚美，而不是進行批判性的思考或糾錯。

破解大法：假裝是「同事」的想法

為了繞過AI這個「順情說好話」的機制，Yoshua Bengio分享其個人的「反向欺騙」技巧：

他不再以自己的名義提問，也不會說「這是我的想法」。相反地，他會將自己的觀點偽裝成「某位同事的觀點」發送給AI，並且詢問AI的看法。

事實證明，這種心理戰術相當有效。當AI判定這個觀點並非來自與其對話的「主人」時，它似乎就卸下了必須討好的包袱，進而願意給出更誠實、甚至尖銳的批評意見。

OpenAI 也曾翻車：被戲稱「賽博舔狗」

Yoshua Bengio指出，這種現象是AI價值觀「未對齊」 (Misalignment)的典型案例。事實上，這個問題在業界並不罕見。

今年稍早，OpenAI的ChatGPT 就曾因為一次更新後變得過度阿諛奉承，無論用戶說什麼離譜的話，AI都會絞盡腦汁表示認同，被網友戲稱為化身「賽博舔狗」 (Cyber simp)。最終，OpenAI不得不緊急撤回該版本更新來修正這個行為模式。

分析觀點：RLHF的副作用？

筆者認為，AI這種「報喜不報憂」的特性，很大程度上源自於目前主流的訓練方法——基於人類回饋的強化學習 (RLHF)。

在訓練過程中，AI學習到當它給出「令人愉悅」或「有禮貌」的回覆時，通常會獲得較高的人類評分。久而久之，模型就學會了「順著毛摸」的生存法則，甚至為了禮貌而犧牲了真實性。

對於像Yoshua Bengio這樣的頂尖學者來說，這無疑是個災難。因為科學研究需要的是證偽與批判，而不是無意義的讚美。看來在AI學會真正的「客觀」之前，我們不僅要學會提示工程 (Prompt Engineering)，還得學會一點「演技」才行。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

📌 數位新聞搶鮮看！

　訂閱《科技玩家》YouTube頻道！
💡 追新聞》》在Google News按下追蹤，科技玩家好文不漏接！
📢 eneloop充電電池開箱！實測高續航力ㄅ級分絕配富士instax mini 41 拍立得
📢 便宜資費懶人包／5G 399元比4G便宜新方案「每月加100」上網升級
📢 三星爆有4款新摺疊機！神祕新機型號現身傳為平價Galaxy Z Fold8 FE
📢 LINE免費貼圖！報稅「錢錢再見」、PASS拒絕哏圖好用還有蠟筆小新快下載
📢 買預付卡出國漫遊…回國竟涉詐欺案釣出一票人「忽略SIM卡1事」全中獎
📢 懶人包／預付卡有使用期限嗎？出國漫遊用完SIM卡可丟嗎？QA一次看

Netflix全面遷移至Amazon Aurora資料庫效能提升75%、成本節省28%

拉斯維加斯實測：亞馬遜Zoox無人計程車試乘如「未來移動艙」、有遺落物會提醒

CASETiFY三麗鷗狗狗好朋友配件開箱！iPhone手機殼、耳機殼、無線充電盤可愛爆擊

母親節手機特價優惠！vivo旗艦省7千、iPhone 17 Pro Max折扣3010元

iOS 26.5 RC版更新重點總整理！RCS 加密、Apple Maps新功能與付費方式

AI 人類 OpenAI 模型機器人更新禮貌聊天 ChatGPT

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者，目前為自由寫手與Mashdigi網站 (mashdigi.com)創辦者身分，平常喜歡電玩、科技類新品，以及軟體、網路相關內容，也喜歡隨手撰寫內容介紹新玩意。

更多數位新品、技術介紹與科技趨勢內容：https://mashdigi.com/

你也是嗎？公司祭「AI面試」反效果近3成求職者一看到就退出

火辣身材爆紅！挺川普正妹護士竟是AI假人...原創者：MAGA支持者超蠢

醫生專屬的AI助理！OpenAI推出「ChatGPT for Clinicians」以GPT-5.4驅動、供醫療人員免費使用

以社群找尋真實解答？Google AI搜尋將突顯Reddit等論壇「第一手經驗」資訊

Google Home迎來大幅更新！導入Gemini升級攝影機體驗語音助理終於能聽懂連續指令

Sony結盟萬代南夢宮佈局生成式AI PlayStation開發流程全面導入

iPhone沒空間了？他曝手機減肥100GB妙招過來人提醒：LINE別這樣做

蘋果傳找英特爾代工晶片完全仰賴台積電局面恐走入歷史

看準用戶離不開？LINE又砍1福利引網反彈改推3平台：更好用

舊充電線、充電頭別丟！通訊行回收送200元還能換6包衛生紙揪甘心

教學／手抖打錯帳號超麻煩？iPhone內建「掃描神功」：長串號碼1秒輸入

電腦用太久⋯橘貓衝出螢幕「強迫你停工！」 Chrome擴充功能萌翻全網

民怨成功！LINE行事曆「藍色超連結」惱人功能可以關閉了步驟一次看

買預付卡出國漫遊…回國竟涉詐欺案釣出一票人「忽略SIM卡1事」全中獎

5月4G、5G便宜資費懶人包／5G 399元比4G便宜新方案「每月加100」上網升級

台灣寶可夢中心開賣16款新品！淺色皮卡丘、人型百變怪太Q 網哀號：又有黃牛

5月4G、5G便宜資費懶人包／5G 399元比4G便宜新方案「每月加100」上網升級

買預付卡出國漫遊…回國竟涉詐欺案釣出一票人「忽略SIM卡1事」全中獎

民眾自製鼠患地圖！即時通報、傻眼重災區「比想像嚴重」

民怨成功！LINE行事曆「藍色超連結」惱人功能可以關閉了步驟一次看

看準用戶離不開？LINE又砍1福利引網反彈改推3平台：更好用

iPhone沒空間了？他曝手機減肥100GB妙招過來人提醒：LINE別這樣做

蘋果傳找英特爾代工晶片完全仰賴台積電局面恐走入歷史

台灣寶可夢中心開賣16款新品！淺色皮卡丘、人型百變怪太Q 網哀號：又有黃牛

微軟Windows 11終於打破FAT32格式近30年的32GB容量限制一舉放寬至2TB

舊充電線、充電頭別丟！通訊行回收送200元還能換6包衛生紙揪甘心

老人才傳LINE？年輕人聊天改用3大APP 網全點頭：只剩公司在用

2026白沙屯媽祖最後一天現在在哪裡？看粉紅超跑GPS定位、進香直播手機也能追

5月4G、5G便宜資費懶人包／5G 399元比4G便宜新方案「每月加100」上網升級

買預付卡出國漫遊…回國竟涉詐欺案釣出一票人「忽略SIM卡1事」全中獎

民眾自製鼠患地圖！即時通報、傻眼重災區「比想像嚴重」

庫克卸任前真心話！iPhone蘋果地圖是「任內第一大錯誤」回憶：可以先用別家APP

中國高德地圖掌握台灣紅綠燈倒數「零誤差」！運作原理靠它數發部擬禁用

行動電源「自帶插頭」別再用！3個月起火逾20起專家3招防範致命風險

民怨成功！LINE行事曆「藍色超連結」惱人功能可以關閉了步驟一次看

iPhone 18 Pro配色方案曝光！主打「深櫻桃紅」沉穩質感美翻