文章标题
近期,美国法院就汤森路透(Thomson Reuters)与罗斯智能(Ross Intelligence)之间的纠纷作出了一项重要判决,并以此解决了“将合理使用适用于人工智能模型训练的问题”。在这起充满戏剧性的案件中,此前曾认为罗斯智能的人工智能训练可能符合合理使用原则的同一名法官现在则认为此举是不合理的,甚至没有任何争论的余地。尽管这项裁决是法院基于案件独有事实所作出的,但其确实有可能会对涉及人工智能的待决侵权案件产生重大的影响,并有助于厘清可使用受版权保护材料来进行人工智能模型训练的界线。
背景概述
汤森路透拥有其Westlaw数据库法律批注和关键号码系统的版权,这些编辑内容将相关的司法意见组织在了一起并可帮助研究人员驾驭各项法规。罗斯智能是一个人工智能驱动型的法律研究平台,该公司使用上述法律批注训练了那些可为自家产品提供支持的人工智能模型,并且从未向最终用户展示过这些法律批注。汤森路透起诉罗斯智能侵犯了版权。罗斯智能提出了多项辩护意见,其中就包括最引人关注的合理使用。双方都提议进行简易判决。法院最初并不希望就合理使用和其他关键的问题作出简易判决,而是准备对案件进行审判。然而,令人感到惊讶的是,主审法官突然按下了暂停键,表示他正在重新考虑之前所作的裁。如此一来,简易判决又重新回到了桌面上。2025年2月11日,法院就此作出了判决。
判决结果:罗斯智能复制了Westlaw中的法律批注
以版权侵权指控作为起点,法院先是确定了Westlaw的法律批注和关键号码系统拥有版权(因为其含有原创的编辑选项)。随后,法院认定罗斯智能复制了这些材料,并表示罗斯智能用来训练其人工智能的“批量备忘录”看起来更像是法律批注,而不是基本的司法意见,这是“实际进行复制的有力间接证据”。法院并不需要专门的技术经验就能认定,数以千计的法律批注与被告平台所摄取的培训材料基本相似。对此,法官讲道:“作为一名律师和法官,我自己就是Westlaw法律批注的普通用户。因此,我完全有能力在这里确定二者之间存在着实质性相似。”
罗斯智能有关合理使用的辩护意见站不住脚
法院轻易地驳回了罗斯智能有关无意侵权、版权滥用、合并以及场景原则的辩护意见,认为它们都是站不住脚的。
汤森路透,而不是罗斯智能,在涉及合理使用的辩论中占据了上风
法院意见的核心是其对于合理使用展开的分析。法院突然改变了其早先的立场,即罗斯智能的人工智能训练可能符合合理使用的条件。法院最终认为汤森路透在两个决定性因素和整体平衡层面上占据了上风。
法院的考量因素
因素一不支持合理使用,因为罗斯智能构建了一个商业性的、具有竞争力的产品
在迅速认定罗斯智能存在着商业目的(罗斯智能提供了一个营利性的法律研究服务)之后,法院对罗斯智能复制Westlaw法律批注行为是否是转换性的进行了分析。法院从Andy Warhol Foundation for the Visual Arts, Inc.起诉Goldsmith一案中找到了依据。在这起具有里程碑意义的合理使用案例中,最高法院认为,如果原创作品和二次使用具有相同的或者非常相似的目的,并且二次使用具有商业性质的话,那么第一个因素通常会与合理使用相悖,除非用户能够指出另一个强有力的有关复制的理由。根据该标准,法院认为罗斯智能的使用不具有转换性,因为它将汤森路透的法律批注用作人工智能数据,以创建出与Westlaw进行竞争的法律研究工具。
法院接下来将目光转向罗斯智能提出的论点,即法律批注从未向最终用户展示过,而是在幕后转换为了“数字数据”。法院驳回了这种所谓的“中间复制”辩护意见,认为这不同于此前世嘉、索尼和谷歌起诉甲骨文的案件(该案中的中间复制行为被认定为符合合理使用的范畴)。法院表示,这些案件涉及计算机代码,而上述计算机代码本质上是功能性的,是出于实现互操作性的必要才进行复制的。另一方面,在本案中,Westlaw的法律批注本质上是编辑性的(而不是功能性的),没有必要为了实现罗斯智能的新目的而进行复制。
因素二支持合理使用,因为法律批注几乎没有任何创意
尽管法院承认Westlaw的法律批注达到了可获得版权的低门槛,但其指出,上述法律批注主要是总结了一些事实材料,几乎没有任何创造性的表达。因此,法院得出结论,鉴于其主要的事实性质,这些法律批注“远远算不上具有创意的作品”。因此,因素二对罗斯智能是有利的。不过,法院也指出,这个因素“在判定涉及合理使用的争议中很少能发挥出重要作用”。
因素三支持合理使用,因为法律批注不会向用户显示
尽管罗斯智能复制了数千份的法律批注,但法院看到的事实是罗斯智能在其最终成果中并没有使用其中任何的批注。法院就此得出结论:“重要的是,借此向公众开放的内容的数量和实质性。”因此,第三个因素有利于实现合理使用的说法。
因素四不支持合理使用,因为罗斯智能的产品威胁到了Westlaw的商业模式和数据许可机会
因素四被法院称为“判定合理使用的最重要的要素”。法院研究了罗斯智能复制行为可能产生的市场影响,包括现有和潜在的衍生品市场。尽管法院最初将下列问题留给了陪审团(即汤森路透是否有打算许可其法律批注以用于人工智能训练,以及罗斯智能是否真的与Westlaw产生了竞争),但现在其已经确信罗斯智能的产品对Westlaw市场和未来的人工智能训练数据许可机会构成了直接的威胁。
同时,法院还权衡了罗斯智能工具中的潜在公共利益以及有可能对市场带来的重大损害。研究发现,公众免费查阅法律意见的能力足以满足他们了解法律的需求。而且,对于版权界人士比较有利的是,法官明确指出,公众无权要求汤森路透对法律进行解析,版权的目的是鼓励人们开发出对社会有帮助的东西,比如优秀的法律研究工具,它们的开发者有权获得相应的报酬。
关键要点
尽管这起人工智能案件的判决结果对原告有利,但是这仅限于该案的具体事实。其他涉及人工智能和版权的待决案件的原告肯定会将这一裁决吹捧为是他们对人工智能开发者进行索赔的有力支持。然而,法院强调,它是根据罗斯智能的特定用途(即使用受保护的素材构建出其能够用来开展直接竞争的法律研究工具)作出不合理使用的判决的。因此,这项裁决为大型语言和生成式人工智能模型的开发人员留下了充足的空间,以便根据事实基础来区分出他们的案例。
法院严重依赖沃霍尔(Warhol)一案的裁决。本案的判决结果在很大程度上依赖于最高法院提供的沃霍尔框架,该框架聚焦了二次使用是否与原始用途“具有相同的或非常相似的目的”。法院认定罗斯智能的竞争性使用不具有转换性,这让人们普遍担心沃霍尔的框架可能会缩小合理使用的范围。希望提出转换性使用主张的开发人员将需要正面应对沃霍尔案件的判决,尤其是在他们的产品与版权所有者的产品构成直接竞争关系的情况下。
此案为人工智能工具的开发人员提供了重要的指南。法院为开发人员在受版权保护的材料上如何训练人工智能一事划清了界限,即如果开发者的模型有效地利用了他人的编辑劳动成果,并以此创建出了构成竞争的产品(即使底层文本没有向用户显示)的话,那么此举可能不符合合理使用的条件。对合理使用展开分析可能会涉及人工智能模型的训练方法、用途、目的和最终产品的差异。
有关人工智能和版权的诉讼远未结束。目前仍有一些细节问题需要陪审团来作出决定。当事人仍有可能向第三巡回上诉法院上诉。由于这是地区法院的裁决,因此第二巡回上诉法院和第九巡回上诉法院最终可能会就合理使用的问题达成不同或更加广泛的观点。(编译自www.mondaq.com)
翻译:刘鹏 校对:王丹