由芝加哥大学计算机科学研究人员开发的新工具Nightshade,旨在供艺术家们免费下载使用,以干扰AI模型未经同意地抓取和训练他们的艺术作品。该工具发布后的前五天就收到了25万次下载。
“自从发布以来的5天内,Nightshade达到了25万次下载量。”该项目的负责人、计算机科学教授本·赵补充说:“我预计会有极高的热情。但我还是低估了它……反响简直超出了我们的想象。”
对于这款免费工具来说,这是一个良好的开端,并显示出一些艺术家对于保护自己的作品免受未经授权就被用于训练AI的强烈意愿。根据劳工统计局的数据,仅在美国就有超过267万名艺术家。
“我们还没有对这些下载进行地理位置查询。”赵写道。“根据社交媒体上的反应,这些下载来自全球各地。”
Nightshade如何工作以及为什么受欢迎
Nightshade通过改变发布到网络上的艺术作品,或者说在像素级别对它们进行“着色”,使得它们在机器学习算法看来包含完全不同的内容——比方说,一个手提包而不是一头牛。当AI算法基于从网络上抓取的几个“着色”图像进行训练时,它可能会开始根据用户的提示或请求生成错误的图像。
在Nightshade项目页面上,赵教授和他的同事们——Shawn Shan、Wenxin Ding、Josephine Passananti以及Heather Zheng表示他们开发并发布了这个工具是为了“增加未经授权数据训练成本,使得从创作者那里获得图像许可成为一个可行的替代方案。”
2023年1月18日Nightshade发布后不久,对其的并发下载需求之大以至于芝加哥大学的网络服务器不堪重负,开发者不得不添加镜像链接,人们可以从云端的另一个位置下载它的副本。
与此同时,该团队之前的工具——Glaze,它通过微妙地改变像素来防止AI模型学习艺术家的标志性“风格”,使其在机器学习算法看来像是别的东西——自2023年4月发布以来已经收到了220万次下载,据赵所说。
Glaze/Nightshade团队接下来会做什么?
赵和他的研究伙伴们已经提前声明了他们打算发布一个结合了Glaze(防御性)和Nightshade(攻击性)的工具。
至于何时发布,至少最快也要一个月时间。
“我们现在的待办事项清单很长。”赵写道。“结合版本必须经过仔细测试,否则我们不能确保后面不会出现意外。所以我想至少要一个月,或许更长时间,我们才能完成全面的测试。”
同时,The Glaze Project的研究人员也提倡艺术家先使用Glaze,然后使用Nightshade,以保护他们的风格同时干扰AI模型的训练,并且看到艺术家们正在这样做感到振奋,尽管使用两个独立程序有些麻烦。
赵解释说:“我们警告过人们,我们还没有进行全面测试来了解它与Glaze一起工作的效果,而且人们应该在只使用Nightshade发布任何图像之前等待。艺术家社区的回应是说,‘我们会分两步进行,先使用Nightshade再使用Glaze,尽管这样会花费更多时间并且对艺术作品有更明显的影响。’”
Nightshade的开源版本可能也在计划之中。“我们可能会在某个时候推出一个开源版本”赵说。“只是需要更多时间来发布不同版本。”
该项目负责人指出,他和他的同事们并没有,也不期望直接从AI图像生成技术背后的模型制造商那里得到回音,例如OpenAI(DALL-E 2)、Midjourney、Stability AI(Stable Diffusion)等。