水印遍布互联网--原因显而易见。你还能如何保护你的艺术作品或摄影作品,避免它们出现在别人的 PowerPoint 演示文稿中,却没有注明创作者?解决这个问题的最简单方法就是创建像下面这样的可见水印。
这种方法的主要缺点是会损害艺术品本身。没有人会购买和使用这样的猫图像。因此,在减少未经授权的复制的同时,可感知的水印也会阻碍目标受众使用艺术品。
在音乐领域,可感知水印在免费的嘻哈音乐节拍中也很常见。节拍制作者通常会在第一节开始前插入一个带有其品牌名称的声音样本。这既可以防止非法下载,也可以作为免费使用节拍的营销工具。
对于图片库和 Hip-Hop 音乐节拍,常见的做法是在在线预览上打上水印,并在付款后将原始产品发送给客户。然而,这种做法也容易被滥用。只要购买了无水印产品,就可以复制并重新上传到互联网上。
保护知识产权
不可感知水印具有明显的优势: 您可以在不对产品质量产生负面影响的情况下,证明对产品任何数字拷贝的所有权。这就好比一张纸,上面有看不见的墨水。这张纸功能完好,但却带有随时可能泄露的秘密信息。
有了这项技术,创作者可以在作品中编码任何类型的信息。更重要的是,由于他们可以使用解码器,他们可以随时对其原创作品的任何数字副本主张所有权。对于权利人来说,另一个新出现的机会是使用网络爬虫搜索网络,并报告任何被发现的滥用行为。
检测人工智能生成的内容
不可感知水印的另一个重要应用是检测人工智能生成的内容。ChatGPT 和类似人工智能工具的出现引发了人们对互联网上人工智能生成的危险内容可能泛滥的担忧。Meta 或谷歌等科技公司提出了不易察觉的水印系统,作为缓解这一问题的技术突破。它们的工具可以在图像或音乐上添加水印,而不会明显改变质量。
原则上,这是一个值得注意的发展。对于不可感知的水印,只有技术拥有者才能解码和检测出这种水印的存在。以我们上面的例子为例,Meta 和 Google 既拥有隐形墨水,也拥有揭示这种墨水的手段。这使它们能够准确检测和过滤其平台(如 Instagram、YouTube)上使用自己的工具生成的内容。通过合作,甚至像 X 这样的独立平台也可以使用这种技术来限制人工智能生成的错误信息或其他有害内容。
虽然不可察觉的水印听起来很有前景,而且正在被大型科技公司推广,但它们远非完美。事实上,许多水印都可以通过智能人工智能算法可靠地去除。但是,人工智能如何才能去除难以察觉的水印呢?
去除可感知的水印
让我们先来了解一下如何利用人工智能去除可感知的水印。让我提出一个简单的方法: 首先从网上收集成千上万张图片。然后,在这些图片上自动添加人工水印。确保它们与真实水印相似,并涵盖各种字体、大小和样式。然后,训练人工智能去除水印的能力,方法是反复向人工智能展示相同的图片对--一次有水印,一次无水印。
虽然肯定还有更复杂的方法,但这说明,如果人工智能经过训练,能够识别水印的外观或声音,就可以轻松去除水印。网上有很多工具可以轻松去除上面猫咪图片上的水印:
去除难以察觉的水印
要使用上述这种简单的方法,你需要向人工智能提供 "之前和之后 "的例子。但是,如果水印难以察觉,又如何找到这些示例呢?更糟糕的是,我们甚至无法通过观察图像或聆听歌曲来判断是否存在水印。
为了解决这个问题,研究人员不得不发挥创意。Zhao 等人于 2023 年提出了一个两阶段程序。
这种方法非常出色,因为它挑战了人们的直觉,即要去除水印,就必须能够检测到水印。这种方法无法定位水印。不过,如果唯一的目的是去除水印,那么只需在图像中加入足够的白噪声,就能快速有效地破坏水印。
当然,添加噪点后,水印可能会被破坏,但最终得到的却是一张噪点图片。最吸引人的部分是作者如何从噪声中重建原始图像。为此,他们使用了人工智能扩散模型,如DALL-E 3或Midjourney中使用的模型。这些模型通过迭代将随机噪音转化为逼真的图片来生成图像。
作为副作用,扩散模型也是非常有效的去噪系统,无论是图像还是音频。利用这项技术,任何人都可以通过精确的两步程序去除难以察觉的水印。
是,也不是。一方面,迄今为止发明的任何不可感知水印系统都有可能被坏人通过某种方法破解。
针对赵等人(2023 年)提出的攻击方法,显而易见的防御方法是开发一种对其具有鲁棒性的隐形水印系统。例如,我们可以训练我们的水印系统,使当前的 SOTA 扩散模型在用随机噪声去除水印后不能很好地重建图像。或者,我们也可以尝试构建一种能够抵御随机噪声攻击的水印。无论哪种情况,新的漏洞都会很快被发现和利用。
那么,难以察觉的水印是否毫无用处呢?莎伦-戈德曼(Sharon Goldman)在最近的一篇文章中认为,虽然水印可能无法阻止坏人,但对好人还是有好处的。水印有点像元数据,但直接编码到相关对象中。与 MP3 元数据不同的是,MP3 元数据可能会在音频转换成其他格式时丢失,而不易察觉的水印则始终是可追踪的,因为它们是直接嵌入音乐本身的。
不过,老实说,我曾希望不可感知水印能成为标记和检测人工智能生成内容的可行解决方案。显然,我错了。总的来说,这些水印并不能阻止坏人在互联网上充斥有害的人工智能生成内容。
制定对策
如上所述,针对已知的攻击算法开发反制措施始终是一种选择。不过,在很多情况下,攻击者更容易迭代其攻击算法,而防御者则更容易开发防护措施。不过,我们也不能忽视一种可能性,那就是我们可能会发现一种不那么容易破解的新的水印方法。因此,我们绝对值得投入时间和资源进一步研究这一课题。
针对水印攻击者的法律后果
虽然用人工智能生成图片并上传到社交媒体平台一般不被视为违法,但故意去除人工智能生成的图片上的水印很可能是违法的。
当然,普通用户分享他们在网上找到的图片不在此列。但是,故意去除水印以传播错误信息显然是不道德的。即使法律压力无法根除滥用行为(从来没有根除过),它也可以成为一个缓解因素。
重新思考所有权证明
围绕区块链技术和/或智能合约如何帮助证明数字时代的所有权,存在许多方法。简单来说,区块链是一种跟踪网络成员之间互动的信息存储。每笔交易都能被唯一识别,并且在以后的任何时间点都无法篡改。将智能合约添加到这个网络中,我们就可以将交易与具有约束力的责任联系起来,一旦交易完成,这些责任就会自动履行。
不那么抽象地说,区块链和智能合约未来可用于自动检查所有权或支付任何形式的知识产权使用费。迄今为止,此类系统尚未得到广泛应用。不过,我们可能只需取得一些技术突破,这些技术就会成为我们经济中的宝贵资产。
数字水印早在互联网诞生之初就被用于防止图像或音乐等知识产权被滥用。最近,人们开始讨论将其作为标记和检测人工智能生成内容的一种方法。然而,事实证明,人工智能不仅擅长生成虚假图像。它同样擅长去除这些图像上的任何水印,从而使大多数检测系统失去作用。
显然,我们不能因此而放弃寻找人工智能时代证明所有权的替代方法。通过制定具体的技术和法律对策,同时探索未来如何利用区块链和/或智能合约,我们也许就能找到解决这一重要问题的方法。