多名作家指控NVIDIA訓練人工智慧模型涉及影響其著作權
在紐約時報、諸多作家指控OpenAI及微軟利用其報導文章內容訓練人工智慧模型之後,相關報導指稱不少作家也發起集體訴訟,指控NVIDIA以其著作內容訓練其端對端的雲端原生框架NeMo平台涵蓋的大型自然語言模型Megatron。
訴訟中指稱,NVIDIA在Megatron的訓練過程使用名為The Pile的資料集,而此資料集包含Book3的資料內容,但Book3資料內容卻包含19萬6640萬本盜版書籍的Bibliotek資料,因此涉及使用作家創作內容。
因此,包含Abdi Nazemian、Brian Keene與Stewart O'Nan在內作家認為NVIDIA在實質上影響其著作權,除了要求NVIDIA撤除、銷毀所有使用Book3資料內容項目,並且要求對其造成影響提供賠償。
不過,NVIDIA方面表示建立NeMo平台時的流程符合著作權法相關規定,同時也強調尊重內容創作者權益。
至於原本透過機器學習模型與資料集共享平台Hugging Face提供使用的Book3資料內容,目前已經被Hugging Face註記涉及影響著作權內容,因此目前已經無法提供存取使用。
而若NVIDIA因為使用Book3資料內容構成影響著作權,將有可能必須對受影響的作家提供賠償,同時也可能必須重新建立NeMo平台涉及影響部分。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》
留言