文章标题
GitHub是一个代码托管平台,已被微软收购。微软首次在其最新的季度报告中公布了GitHub的收入和订阅数据。GitHub上的Copilot是一个基于人工智能的结对编程服务,已经颇受大众欢迎。
GitHub现在的现收入为10亿美元,高于被收购时的2亿至3亿美元。该平台现在拥有9000万活跃用户,高于去年11月的7300万。收入和用户数据的增长大部分归功于Copilot。
当Copilot首次推出时,人们便开始担心,因为它的机器学习模型是基于人工智能公司OpenAI的Codex系统,包括受版权保护的代码。毕竟,Codex使用了数十亿行公开可用的源代码进行训练,包括GitHub上公共存储库中的代码。
日前,身为律师、设计师和开发人员的马修.巴特里克(Matthew Butterick)宣布他正在与集体诉讼律师事务所约瑟夫萨维里律师事务所(Joseph Saveri Law Firm)合作,以调查对GitHub提出版权诉讼的可能性。现在,这种可能性已成为现实。
11月3日,他们在美国加利福尼亚州北区联邦地区法院对微软及其合作伙伴提起集体诉讼。他们称Copilot是一个基于人工智能的系统,使用公开可用的开源许可代码进行训练。虽然GitHub声称它为程序员生成的代码不仅仅是代码副本,但诉讼指出事实就是如此。原告称:“被告声称Codex和Copilot没有保留他们接受培训的材料的副本。然而,在实践中,输出内容经常与源自训练数据的代码几乎相同。”
简而言之,他们声称Copilot只是一个侵犯版权的模仿者。
微软无法反驳这些事实。Copilot基于开放源代码。真正的问题是他们的行为是否侵犯了代码的版权。是“合理使用”还是知识产权窃取?这是一个复杂的问题,不会很快得到解决。
巴特里克表示:“这是漫长旅程的第一步。据我们所知,这是美国第一起挑战人工智能系统训练和输出的集体诉讼案件。这不会是最后一次。人工智能系统不能免除法律责任。创建和运营这些系统的人必须负责。”
GitHub声称,“我们从一开始就致力于与Copilot一起负责任地进行创新,并将继续开发产品,为全球开发人员提供最佳服务。”
微软和OpenAI尚未对该诉讼发表评论。
与此同时,开放源领导者仍在考虑这场诉讼的所有后果。开放源促进会(OSI)资深人士西蒙.菲普斯(Simon Phipps)提到,他认为“目前唯一可以得出的结论是,法律不确定性使Copilot不适合用于开源项目”。
软件自由保护协会(SFC)解释称,问题很可怕而且很重要,并不简单。例如,开源许可问题的一个重要原则是“面向社区的执法绝不能优先考虑经济利益”。就其本质而言,集体诉讼倾向于经济赔偿。
SFC希望原告“认可这些原则。我们确实与您一样感到沮丧和愤怒,因为微软的GitHub一直在侵权,微软和GitHub拒绝与社区合作处理其有损自由和开源软件(FOSS)的活动和前所未有的许可违规行为。FOSS许可不是主要关于商业模式或财务回收的。GitHub对Copilot采取的行动是冒犯性的,主要是因为它试图破坏专门设计的通用公共许可(copyleft)系统,该系统旨在确保用户、开发人员和消费者都拥有平等的权利。
对于Copilot用户来说,危险也可能很大。如果原告针对GitHub的案件胜诉,使用它生成的每一段代码都可能受到各种开源许可的约束。
这场诉讼——赢、输或平——将改变人们使用开源软件和人工智能/机器学习的方式。(编译自www.theregister.com)
翻译:罗先群 校对:刘鹏