為了解決從公開網頁環境擷取資料涉及隱私 及著作權爭議,OpenAI 宣布推出名為GPTBot的網頁爬蟲技術,將以更透明方式蒐集人工智慧 訓練時所需資料。
OpenAI表示,GPTBot 將以完整字串及代幣方式闡明其爬蟲機器人身分,同時其所抓取公開網頁資料僅用於改良未來人工智慧模型 ,並且剔除抓取需要付費使用內容。
不過,如果網頁經營維護者不希望被GPTBot擷取內容的話,例如網頁可能存放大量涉及個人隱私等內容,僅需在網頁架構中的robots.txt檔案加入「GPTBot」描述,或是自訂GPTBot可抓取內容,甚至OpenAI也提供直接透過限制IP存取範圍方式禁止GPTBot抓取網頁資料的方式,讓網頁經營維護者能避免內容被GPTBot抓取。
過去就有不少網頁透過設定,讓各家搜尋引擎無法透過爬蟲方式擷取網頁資料,而在人工智慧技術持續成長趨勢之下,越來越多人工智慧訓練仰賴大量公開資料進行學習,因此也加深許多網頁經營者擔心內容被用於人工智慧訓練,進而產生有價資料受影響,或是影響隱私安全等問題,因此要求人工智慧技術提供者必須以合理方式取用網頁資料。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
📌 數位新聞搶鮮看!
訂閱《科技玩家》YouTube頻道!
💡 追新聞》》在Google News按下追蹤,科技玩家好文不漏接!
📢 鳳凰颱風走到哪裡了?看颱風最新動態、即時路徑 6平台吸千人24小時報現況
📢 日本西瓜卡升級新功能!儲值上限變30萬日圓、吉祥物Suica企鵝2026下台告別
📢 iPhone 20告別瀏海與挖孔!蘋果首款全螢幕無開孔手機長這樣
📢 懶人包/普發一萬領現金最安心!指定ATM去哪找?LINE一鍵查詢領錢管道
📢 三星Galaxy S26+渲染圖外觀曝光!旗艦機Galaxy S26 Ultra自拍能塞更多人
📢 蘋果HomePod mini 2「推出機率更高」!零售商「停產」洩密 新品功能曝光

登(加)入 udn 會員不只享專屬優惠,現在再送 LINE POINTS 5 點!即日起至 11/20,不論新朋友或老朋友,輕鬆加入就有獎 ( 每日限量 1,000 組,不定時放送 ),馬上入手點數,讓生活多一點開心回饋。