文章标题
11月7日,美国纽约南区地方法院驳回了Raw Story媒体和Alternet媒体对OpenAI提起的版权侵权诉讼,认为这两家新闻机构缺少提起诉讼的立场。不过,法院为这两家网站修改诉状保留了可能性。
诉状称,这些新闻机构“成千上万”的版权文章被互联网抓取,然后“剔除了作者、标题和版权信息,输入到OpenAI的至少三个训练集(WebText、WebText2和Common Crawl)”,然后用于训练OpenAI的聊天机器人ChatGPT。因此,ChatGPT提供的回复包含了没有注明来源的版权作品中收集的信息。这些新闻网站还认为,根据《数字千年版权法》(DMCA)第1202(b)(i)条的规定,在训练ChatGPT之前删除版权管理信息(CMI)构成侵权。这些新闻网站还要求法院下达禁令,阻止OpenAI通过当前版本的ChatGPT向用户生成侵权回复。OpenAI则反驳称,这些新闻网站缺乏追诉资格且法院没有管辖权。
这些新闻机构称,从版权作品中移除CMI构成了具体损害,而且由于新版ChatGPT存在“逐字或几乎逐字”生成版权保护作品的“实质性风险”,因此禁令申请是有正当理由的。但OpenAI辩称,“这两种损害理论没有事实上足以确立诉讼资格的具体伤害”,法院对此表示同意。
首先,法院称原告未能“主张ChatGPT在回应任何具体询问时向任何人传播了删除了CMI的作品副本”。虽然新闻机构辩称,删除CMI类似于版权侵权,通常构成产权的干扰,而这是普通法所承认的具体损害,但地区法院法官写道:“我不相信对干扰产权所造成的损害为原告所称的损害提供了必要的‘接近历史或普通法的类似物’”。法院称,原告对第1202条的理解有误,该条款只保护“作品的CMI的完整性不受特定干扰”,并没有完全禁止作品的复制或衍生品。法院写道:“我不相信,仅仅从版权作品中删除识别信息——并未传播——就构成任何历史或普通法上的相似之处。由于被删除了CMI的版权作品被用于训练人工智能软件程序,并保留在ChatGPT的文本库中,新闻机构未能证明任何因违反DMCA而产生的实际不利影响”。因此,他们未能证明损害赔偿要求所需的法定条件。
至于禁令救济,即要求OpenAI删除原告版权作品的所有副本,这些副本中的作者、标题、版权和使用条款信息已从原告的训练集和任何其他资源库中删除,法院称原告未能证明其文章的信息本身受版权保护。法院写道:“考虑到资源库中包含的信息数量,ChatGPT从原告文章中输出剽窃内容的可能性似乎微乎其微。虽然新闻机构提交的证据显示ChatGPT的早期版本确实输出了剽窃内容,但原告并没有合理地主张当前版本的ChatGPT会产生剽窃原告文章的回复这一重大风险。”
不过,该意见书确实承认,原告可能用一些合法的方式来主张救济,因为OpenAI“使用了原告的文章来开发ChatGPT,却没有对原告进行补偿”,尽管这个问题并没有摆在法庭面前。法官允许原告在提交拟议的修订诉状的同时,解释拟议修订诉状的合理性。(编译自ipwatchdog.com)
翻译:吴娴 校对:刘鹏