纽约时报可以在对OpenAI的诉讼中获得胜利吗?

2024年01月02日 由 samoyed 发表 292 0

纽约时报正在加大对OpenAI的版权诉讼力度。自从案件宣布以来,纽约时报已经积累了很多对OpenAI的证据。这可能是第一个在法庭上站得住脚的版权侵权案例。但结果还有待观察。


该诉讼于周三,12月27日在曼哈顿联邦法院提起,指控OpenAI未经许可使用其数百万份版权文章来训练ChatGPT模型。


using-times-data-to-train-llms-1300x731


纽约时报声称,这种做法不仅侵犯了他们的版权,还将这些人工智能模型定位为其新闻产品的直接竞争对手。虽然以前很难证实这些指控,但原告提供了令人震惊的证据。


纽约时报可以获得成功吗?


Times之前曾在4月份与微软和OpenAI进行了和解,并希望达成一个“友好的”解决方案,达成商业协议,并在其网站周围增加技术保护措施,但并未得出结论。


在此之后,纽约时报在8月份宣布打算起诉OpenAI之前更改了政策。他们在8月3日更新了他们的服务条款,限制了其内容作为人工智能训练的使用。


这包括所有形式的内容,并明确禁止未经书面许可使用自动数据收集工具。此外,OpenAI和微软也为他们的服务引入了类似的措施,网站可以阻止爬虫抓取他们网站的数据,这反映出一个更广泛的行业趋势,即对AI开发使用网络来源数据进行控制。


这一次的案件有了更强的论据


对AI提起版权诉讼的一个主要难题是原告无法证明AI模型确实使用了他们的数据。这创造了一个法律灰色地带,如果AI产生了与受版权保护的作品相似的内容,这是侵权还是仅仅是巧合?


在这个案件中,纽约时报对OpenAI进行了四项指控,即训练数据集,大型语言模型(LLM)在其参数中编码副本,对查询的记忆化文章的输出,以及使用浏览插件输出文章。


考虑到证据和原告的身份,这个案件不仅可能与之前类似的案件有不同的结果,还可能为这一领域未来的法律设定一个重要先例。LLM并不是通过检索存储的数据来生成内容,而是通过模仿大量训练语料库中的模式,这个过程被称为“近似检索”。这意味着输出不是直接复制,但可以紧密地反映训练集中文本的风格和结构。


这很有趣,因为诉讼中没有信息说明使用了什么样的提示来得到这个输出。并且就像一位用户指出的那样,在法庭上重现类似回应会很困难。


在这样的背景之下可能会出现一种更具合作性的解决方法。就像之前OpenAI与其他公司达成的合作关系那样。


这类合作可能涉及许可协议,内容创作者因其对AI训练数据集的贡献得到回报。这种方法不仅解决了版权问题,还促成了一种双赢的关系,其中双方都从中受益——内容创作者得到补偿和认可,而AI开发商获得高质量、合法的数据集。


纽约时报对OpenAI的诉讼结果可能会影响AI公司与内容创作者之间未来的关系。这个案件会导致更多的法律争议,还是为合作伙伴关系铺平道路,将在很大程度上影响这两个行业在未来如何发展。无论如何,对于内容创作的未来,尤其是新闻业,这些都具有深远的意义,值得密切关注。

文章来源:https://analyticsindiamag.com/nyt-doomed-to-fail-like-its-predecessors/
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消