在Meta、Microsoft、Stability AI、Midjourney等公司努力的同时,Steg.AI也在不断地努力中遥遥领先。
2023年5月,全球在震惊中目睹五角大楼被烟雾笼罩的画面。许多新闻频道根据这些画面报道了这一事件,甚至股市也做出了反应,在短时间内下跌。后来,事实证明这是一张由人工智能生成的假图片。
这些事件凸显了在各种情况下识别人工智能生成内容的挑战。它们也再次引发了关于深度伪造和假图片的更大讨论,这得益于生成式人工智能工具及其根据提示生成逼真图片的能力。
所有这些都导致全球各国政府争相寻求解决方案和安全监管人工智能的方法。包括亚马逊、Anthropic、谷歌、Inflection、Meta、微软和OpenAI在内的著名人工智能公司自愿承诺采取措施,如对人工智能生成的内容添加水印以增强其安全性,但目前还没有实质性的进展。
目前的方法,例如对数据进行图像或音频编码,可以被轻松绕过。所以一种强大的、不可见的水印,容易应用和检测,同时又能抵抗变换,是很必要的,因为研究表明,人们很难区分人类生成的内容和人工智能生成的内容。由于在线知识产权盗窃猖獗,能够证明内容创建来源的能力变得越来越重要。
与此同时,总部位于加利福尼亚州的平台Steg.AI已经开发出一种基于深度学习的解决方案,将几乎无法察觉的水印嵌入数字内容中。即使图像被修改、压缩或操纵,Steg.AI的水印仍然完好无损。这些水印非常坚固,甚至可以在屏幕上或打印时使用iPhone相机捕捉到。
Steg.AI的水印解决方案在各种场景中都有应用,比如股票摄影服务、Instagram等平台上的内容共享、电影的预发布副本和保护机密文件。其早期产品的发展面临着挑战,这导致他们将注意力转向了稳健性,这一突出特点深受客户青睐。
Steg.AI的核心概念是在发布之前将水印无缝地整合到人工智能生成的图像中。虽然具体的过程是保密的,但基本思想围绕着一对机器学习模型。一种模型根据图像自定义水印的放置位置,确保肉眼无法察觉,同时能够被解码算法检测到。
类似于一个几乎不可见、基本不可改变的QR码,这种方法潜在地可以容纳几千字节的数据,足以用于URL、散列函数和纯文本信息。多页文档的每一页或视频帧都可以隐藏不同的代码,从而成倍增加容量。
该公司的广泛工作可以追溯到2019年的一篇CVPR论文,以及对Phase I和Phase II SBIR政府拨款的收购。联合创始人Eric Wengrowski和Kristin Dana之前参与过学术研究,他们多年来一直致力于完善自己的方法。
Steg.AI的进展得到了NSF拨款和天使投资总计120万美元的支持。最近,该公司宣布取得了重要里程碑,获得由Paladin Capital Group领投,Washington Square Angels、NYU Innovation Venture Fund和个人天使投资者参与的500万美元种子轮融资。
主要科技公司已经采取措施将水印技术应用到他们的内容中。微软在其年度Build大会上宣布,在Bing Image Creator和Designer中增加了新的媒体来源功能,使用户能够验证人工智能生成的图像和视频。这一创新涉及加密方法来标记和签署具有指示其来源的元数据的内容。 为此,网站必须采用与Adobe、Arm、Intel、微软和Truepic共同开发的内容来源和真实性联盟(C2PA)规范。
然而,微软努力的影响取决于广泛的媒体起源标准的采用,并得到Stability AI和谷歌等公司的支持,这些公司也在探索类似的方法。Shutterstock和Midjourney已经采用了指导方针,以嵌入指示生成人工智能创建内容的标记。
另一方面,Meta AI、雷恩第一大学国际研究中心和索邦大学进行的合作研究开发了一种创新技术,它可以在图像生成过程中无缝地整合水印,同时保持架构的完整性。该方法修改了预训练的生成模型,有效地将水印整合到生成的图像中,提高了安全性和计算效率。这项技术使模型提供商能够为不同的用户组分发具有不同水印的模型版本,从而促进道德使用监控。
这种技术对媒体机构在识别计算机生成图像方面非常有价值。研究人员利用潜在扩散模型(LDM)成功地将水印与生成模型进行了最小程度的调整相结合。这个过程涉及使用感知图像损失和被称为HiDDeN的简化深度水印方法的隐藏信息损失来对LDM解码器进行微调。该技术在图像编辑任务中表现出很强的性能,即使在严重剪裁的图像中也能保持原始模型在各种基于LDM的任务中的效用。
上个月,这七家大型科技公司的举动支持了拜登政府加强对蓬勃发展和受欢迎的人工智能技术的监管的努力。美国国会还在审议一项法案,要求必须披露人工智能在政治广告中的参与情况。