Sarah Silverman起诉OpenAI和Meta侵犯版权
2023年07月10日 由 Susan 发表
965306
0
喜剧演员和作家Sarah Silverman,以及作家Christopher Golden和Richard Kadrey在美国地方法院对OpenAI和Meta提起了侵犯版权的双重诉讼。
诉讼指控,OpenAI的ChatGPT和Meta的LLaMA聊天机器人在非法获取的数据集上进行训练,这些数据集包含了原告的作品,据称这些作品是从"Bibliotik"、"Library Genesis"、"Z-Library"等"影子图书馆"网站上非法获得的,指出这些书籍 "可以通过种子系统大批量获取"。
Christopher Golden和Richard Kadrey均拒绝就此诉讼发表评论,而Sarah Silverman的团队截至新闻发布时间没有回应。
在OpenAI的诉讼中,原告提供了几个证据,显示当要求ChatGPT对他们的书进行概述时,机器人会侵犯他们的版权。展示中首先概述的是Sarah Silverman的《Bedwetter》,之后还使用了Christopher Golden的《Ararat》和Richard Kadrey的《Sandman Slim》作为案例。原告声称,聊天机器人未能"复制原告在作品中包含的任何版权管理信息"。
至于对Meta的独立诉讼,他们声称作家的书籍可在Meta所使用的训练数据集中获取,这些数据集用于训练其在二月份推出的四款开源人工智能模型LLaMA。
原告在起诉书中详细列出了为何他们认为这些数据集具有非法来源的步骤 - 在Meta的LLaMA详细描述中,公司指出了其训练数据集的来源之一称为ThePile,该数据集由一家名为EleutherAI的公司组合而成。起诉书指出,EleutherAI的一篇论文中称ThePile是从“Bibliotik私人跟踪器”的内容复制而来。起诉书中提到的Bibliotik和其他所列的"影子图书馆"是"明显非法的"。
在这两项诉讼中,原告称他们"未同意将他们的受版权保护的书籍用作公司的人工智能模型的训练素材"。他们的诉讼中包括了六项不同类型的版权侵权、疏忽、非法获利和不正当竞争。原告希望获得法定赔偿、利润追偿等。
代表三名作家的律师Joseph Saveri和Matthew Butterick在他们的LLMlitigation网站上表示,他们已经听到了"对于ChatGPT可以惊人地生成类似于受版权保护的文本材料的文本的能力"而感到担忧的"作家和出版商的声音,其中包括成千上万本书籍"。
Saveri还代表程序员和艺术家对人工智能公司发起了诉讼。Getty Images还提起了一项人工智能诉讼,指控Stability AI,开发了人工智能图像生成工具Stable Diffusion,将其模型训练于"受版权保护的数百万图像"之上。Saveri和Butterick还代表作家Mona Awad和Paul Tremblay在一起类似的诉讼中,该案涉及该公司的聊天机器人。
类似这样的诉讼不仅仅是对OpenAI和其他人工智能公司的一个头疼问题,它们也挑战着版权的极限。正如我们在The Vergecast上多次提到过,每当有人开始谈论版权法时,我们就会看到以这些事情为中心的诉讼还会持续多年。
来源:https://www.theverge.com/2023/7/9/23788741/sarah-silverman-openai-meta-chatgpt-llama-copyright-infringement-chatbots-artificial-intelligence-ai