文章标题
2025年6月,红迪网公司(Reddit,Inc.)在加利福尼亚州高等法院向Anthropic公共利益公司提起了诉讼,指控Anthropic在未经其同意或提供补偿的情况下擅自抓取并商业利用了红迪网的用户数据(包括已删除的帖子)。与其他以确立版权侵权责任为中心的诉讼目的不同,红迪网提出了五个诉因,即对方违约、不当得利、动产侵害、侵权干预以及不公平竞争。此举反映出原告的一种战略选择,即提出基于合同和隐私的指控以处理Anthropic涉嫌未经授权便抓取红迪网数据的行为。
红迪网声称,Anthropic在于2021年12月至2024年10月期间所抓取的已公开的Reddit帖子和评论中训练了其人工智能模型(例如Claude)。Anthropic研究人员所发布的公开声明将Reddit的子社区看成是微调其训练输入的“好样本”。
根据诉状中的内容,红迪网仅会通过指定的“合规应用程序编程接口(API)”授予那些已经获得许可的人工智能合作伙伴以针对其存档内容的有条件的访问权限,而且上述API会在用户删除内容时向被许可方发出警告。然后,根据人工智能合作伙伴与红迪网所签订合同的要求,当事人必须要停止继续使用此类材料,从而尊重用户的隐私权。然而,尽管Anthropic此前拒绝签订此类协议,但该公司仍继续在未经授权的情况下访问了“合规API”,将相关数据用于商业目的,并违反了红迪网的许可条款。尽管红迪网采取了技术监管措施(包括robots.txt指令和IP速率限制),但Anthropic的机器人绕过了这些防御措施,并产生了超过10万次的未经授权的API调用记录,让红迪网承担了巨大的服务器容量成本。据称,这些记录在案的成本实现了对红迪网基础设施造成的有形经济损害的量化,构成了红迪网就动产侵害、违约和不正当竞争提出指控的基础。红迪网提出违约索赔的核心是Anthropic涉嫌违反了红迪网用户协议中的关键条款。具体来说,这些条款禁止他人“商业利用”红迪网的内容,限制未经授权的抓取行为,以及不当访问和使用红迪网的合规API在未经许可的情况下继续使用已删除或受限制的内容。
红迪网的策略似乎旨在强调在没有获得许可的情况下使用数据的后果,同时回避了在人工智能背景下尚未得到解决的版权辩护问题。虽然红迪网在其诉状中没有提到有关版权的声明,但Anthropic仍然可以争辩说,美国的《版权法》效力是优于红迪网所提出的没有涉及版权的声明,因为红迪网的声明涉及Anthropic是如何“使用”并“复制”用户生成内容的,这与美国联邦版权法中的复制和发行专有权存在着密切联系。根据版权优先原则,如果原告根据州法律提出的指控是基于那些与受版权保护的权利相当的权利的话,那么这些指控就是无效的。这意味着与内容使用有关的违约、不当得利和不正当竞争指控可能会遭遇失败。不过,侵权干预指控通常倒是能在上述优先原则下幸存下来,因为它要解决的是合同或业务关系的不当破坏行为,而不是复制行为自身。
对于内容创作者、社交平台和权利持有人来说,红迪网的诉讼揭示了一个至关重要的现实。即仅靠技术限制手段可能无法可靠地防止数据抓取、商业化或滥用行为。虽然API网关、robots.txt和速率限制等工具是必不可少的,并且也推荐人们积极使用,但坚定的侵权者仍可能会逃避这些防御措施。因此,各平台应通过具有法律效力的条款和条件、正式的许可安排(包括合规义务和删除机制)、对API访问和使用情况的实时监控、记录服务器影响以证明对方造成了有形的危害。(编译自www.mondaq.com)
翻译:刘鹏 校对:吴娴