OpenAI推GPTBot的網頁爬蟲技術以更透明方式蒐集人工智慧訓練可用公開資料

2023-08-09 08:29 聯合新聞網楊又肇

為了解決從公開網頁環境擷取資料涉及隱私及著作權爭議，OpenAI宣布推出名為GPTBot的網頁爬蟲技術，將以更透明方式蒐集人工智慧訓練時所需資料。

OpenAI表示，GPTBot將以完整字串及代幣方式闡明其爬蟲機器人身分，同時其所抓取公開網頁資料僅用於改良未來人工智慧模型，並且剔除抓取需要付費使用內容。

不過，如果網頁經營維護者不希望被GPTBot擷取內容的話，例如網頁可能存放大量涉及個人隱私等內容，僅需在網頁架構中的robots.txt檔案加入「GPTBot」描述，或是自訂GPTBot可抓取內容，甚至OpenAI也提供直接透過限制IP存取範圍方式禁止GPTBot抓取網頁資料的方式，讓網頁經營維護者能避免內容被GPTBot抓取。

過去就有不少網頁透過設定，讓各家搜尋引擎無法透過爬蟲方式擷取網頁資料，而在人工智慧技術持續成長趨勢之下，越來越多人工智慧訓練仰賴大量公開資料進行學習，因此也加深許多網頁經營者擔心內容被用於人工智慧訓練，進而產生有價資料受影響，或是影響隱私安全等問題，因此要求人工智慧技術提供者必須以合理方式取用網頁資料。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

📌 數位新聞搶鮮看！

　訂閱《科技玩家》YouTube頻道！
💡 追新聞》》在Google News按下追蹤，科技玩家好文不漏接！
📢 Gmail帳號太中二怎麼修改？3步驟換掉Google ID、還有次數限制
 📢 難尋4G 599吃到飽「問客服也沒用」！內行5招成功拿低價方案
 📢追劇神技！Netflix「隱藏代碼」曝光輸入5碼韓劇全跳出、還有星爺專屬彩蛋
 📢 前進《動物森友會》Xpark海洋生物互動展！動森特典帽子超可愛
 📢DJI Osmo Pocket 4開箱！獨旅6大實測福岡、糸島拍照攝影還能拍富士山超勸敗
 📢 小米Xiaomi 17T Pro開箱！徠卡長焦拍攝絕美人像、捕捉排球少年熱血瞬間

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者，目前為自由寫手與Mas...

OpenAI GPTBot ChatGPT 人工智慧隱私模型

OpenAI推GPTBot的網頁爬蟲技術以更透明方式蒐集人工智慧訓練可用公開資料

楊又肇

推薦文章

華碩日本員工暴躁式宣傳筆電走紅現場猛砸、潑水、踩螢幕

等了5年終於改了！LINE「最困擾1功能」搬家不會再誤觸

影／女網紅行動電源爆炸「背包變火球」上半身起火！頭髮頭皮慘燒傷

蘋果也撐不住！庫克認了準備漲價直呼晶片市場如「百年洪水」

怎麼申辦4G 599不限速吃到飽「問客服也沒用」！內行人5招成功拿低價方案

果粉荷包要失血了蘋果調高全球Mac、iPad售價…但iPhone沒漲

OpenAI推GPTBot的網頁爬蟲技術 以更透明方式蒐集人工智慧訓練可用公開資料

楊又肇

推薦文章

華碩日本員工暴躁式宣傳筆電走紅 現場猛砸、潑水、踩螢幕

等了5年終於改了！LINE「最困擾1功能」搬家 不會再誤觸

影／女網紅行動電源爆炸「背包變火球」上半身起火！頭髮頭皮慘燒傷

蘋果也撐不住！庫克認了準備漲價 直呼晶片市場如「百年洪水」

怎麼申辦4G 599不限速吃到飽「問客服也沒用」！內行人5招成功拿低價方案

果粉荷包要失血了 蘋果調高全球Mac、iPad售價…但iPhone沒漲

OpenAI推GPTBot的網頁爬蟲技術以更透明方式蒐集人工智慧訓練可用公開資料

華碩日本員工暴躁式宣傳筆電走紅現場猛砸、潑水、踩螢幕

等了5年終於改了！LINE「最困擾1功能」搬家不會再誤觸

蘋果也撐不住！庫克認了準備漲價直呼晶片市場如「百年洪水」

果粉荷包要失血了蘋果調高全球Mac、iPad售價…但iPhone沒漲