紐時:OpenAI「不小心」刪資料 阻礙查找使用未授權內容訓練AI的證據

聯合新聞網 楊又肇

去年底指控OpenAI與微軟在未經許可情況下,不當使用其超過數百萬篇文章內容,並且用於訓練聊天機器人服務之後,紐約時報稍早於法院遞交聲明中表示,OpenAI內部工程人員曾「不小心」刪除紐約時報團隊花費超過150小時研究、整理的人工智慧訓練資料,雖然在後續使部分資料恢復,卻巧妙地讓顯示OpenAI何時將訓練內容複製到人工智慧模型內的原始檔案名稱、資料夾結構維持「遺失」。

紐約時報委任律師Jennifer B. Maisel向法院表示,OpenAI承認相關資料被刪除,但強調不久之後就已經將資料恢復。而Jennifer B. Maisel表示,紐約時報必須再次花費大量時間重新整理這些被恢復資料,卻發現仍有原始檔案名稱、資料夾結構等資訊未被恢復。

在遞交給法院作為證據的電子郵件內容中,OpenAI顧問Tom Gorman將相關資料遺失說明為「不正常的故障」,但Jennifer B. Maisel更傾向認為此舉為故意行為。

不過,OpenAI發言人Jason Deutrom則表示紐約時報指控說法並非事實,更說明將對此做出相關澄清。

在去年提出指控時,紐約時報認為OpenAI及微軟企圖以免費形式使用紐約時報內容訓練 人工智慧,並且以此向眾人提供服務,因此認為有影響內容著作權的情形。而紐約時報在後續進行相關佐證資料整理時,更指稱OpenAI服務會出現嚴重且反覆的技術問題,導致無法有效搜尋相關訓練資料,藉此釐清OpenAI涉及侵權涵蓋範圍。

隨著紐約時報與OpenAI之間訴訟仍在進行階段,OpenAI目前則是與多家出版業者達成授權協議,其中包含大西洋月刊 (The Atlantic)、阿克塞爾斯普林格集團 (Axel Springer)、沃克斯傳媒 (Vox Media)、WIRED雜誌母公司康泰納仕出版集團 (Condé Nast),而市場看法則預期紐約時報與OpenAI之間訴訟結果,將會成為人工智慧產品日後發展重要參考。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》

楊又肇

曾任聯合新聞網 (udn.com)數位頻道記者,目前為自由寫手與Mas...

OpenAI 紐約時報 人工智慧 微軟

推薦文章

留言