生成可信的假照片愚弄人类,一场与人工智能对决的“猫和老鼠” 游戏
2018年01月04日 由 yining 发表
498834
0
这张图片是由英伟达(Nvidia)开发的软件所生成的假名人照片之一
在芬兰的一所实验室里,一个由英伟达研究人员组成的小组最近建立了一个系统,可以分析成千上万的(真实的)名人快照,识别共同的模式,并创造出看起来几乎相同的新图像。该系统还能生成马、公交车、自行车、植物和许多其他常见物体的逼真图像。
该项目的目的是建立能够自动产生令人信服的图像的技术,或者以同样令人信服的方式改变现有的图像。我们希望这项技术能够显著加速和改进计算机接口、游戏、电影和其他媒体的创建,最终让软件能够在瞬间创造出逼真的图像,而不是花费一天甚至几天的时间。
近年来,得益于一种能够通过分析海量数据来学习任务的算法,像谷歌和Facebook这样的公司已经建立了能够识别人脸和普通物体的系统,它们的准确度与人类的眼睛不相上下。现在,他们和其他公司,以及世界上许多顶尖的学术人工智能实验室,都在使用类似的方法来识别和创建图像。
英伟达的图像无法与顶级相机的图像分辨率相匹配,但即便是在最大型的智能手机上,它们也非常清晰并且令人信服。
例如,看看下面的两张照片,看看你是否能判断出哪个人是真实的。
(1)
(2)
与其他著名的人工智能研究人员一样,英伟达团队相信,推动这个项目的技术将在未来的几个月和几年里继续改进,产生更大、更复杂的图像。
“我们认为我们可以进一步推进这项技术,不仅仅是照片,还有可以在电脑游戏和电影中使用的3D图像,”Jaakko Lehtinen说道,他是这项工程的研究人员之一。
如今,许多系统使用一种叫做神经网络的复杂算法来生成图像和声音。这是一种在大量数据中识别模式的方法。例如,通过识别成千上万辆汽车照片中的常见模式,神经网络可以学会识别汽车。但它也可以使用这些模式来生成自己的汽车照片。
英伟达开发了一个系统,它建立了两个神经网络,一个生成图像,另一个试图确定这些图像是真实的还是假的。这些被称为“生成对抗网络”,简称GANs。从本质上讲,一个系统能愚弄另一个系统,而另一个系统则尽力不被愚弄。
Lehtinen说:“计算机学会通过玩“猫和老鼠”的游戏来产生这些图像。”
这一系列的图片显示了英伟达的系统在18天的处理过程中所产生的输出。英伟达的研究人员用他们称为“渐进的生成对抗网络”的方法建立了一个以低分辨率图像开始,然后逐渐发展到更高的分辨率的系统。这使得训练可以更迅速地进行,但也可以以一种更可控、更稳定的方式进行。产生的结果是:1024*1024像素的图像。来源:英伟达
英伟达的第二组研究人员最近建立了一个系统,可以自动改变夏天拍摄的街道照片,让它看起来像一个下雪的冬季场景。加州大学伯克利分校的研究人员设计了另一种研究,将普通的马转化为斑马。总部位于伦敦的人工智能实验室DeepMind正在探索能够生成自己视频的技术。Adobe正在开发类似的机器学习技术,希望将它们融入到像Photoshop这样的产品中。
设计师和工程师们长期以来一直使用Photoshop等程序来制作逼真的图像。不过,OpenAI研究员Durk Kingma认为,机器学习如何自动生成这些图像变得越来越容易。
他说:“我们现在有了一个可以生成更多样化的面孔的模型,在某些方面比我们手动编程更现实。”
但是,新的问题也随之而来。我们可能很快就会面临比现在更广泛的伪造图像现象的发生。
人工智能伦理和治理基金协会的主管Tim Hwang说:“令人担忧的是,随着这些技术的提升,我们就很难辨别图像的虚假。”他还补充,“你可能会相信这加剧了我们已经存在的问题。”
每一幅图像都需要大约18天的时间才能生成,然后才能达到系统所认为的可信的程度。来源:英伟达
尽管这类照片生成目前仅限于静态图像,但许多研究人员认为它可以扩展到视频、游戏和VR中。Kingma说,实现这一想法可能需要花费数年时间,因为这将需要更大的计算能力。这也是英伟达和其他芯片制造商共同努力的主要问题。
研究人员还在广泛的使用其他机器学习技术,以更有说服力的方式来编辑视频。
[video width="1280" height="720" mp4="https://www.atyun.com/uploadfile/2018/01/videoplayback-1.mp4"][/video]
今年8月,华盛顿大学的一个小组制作了一个可以将新单词输入奥巴马视频的系统,从而登上了新闻头条。其他一些人,包括加州初创公司Pinscreen和中国的科大讯飞,正在使用特朗普的照片开发类似的技术。
结果并不完全令人信服。但是,生成对抗网络和其他技术的快速发展表明,任何人都可以更容易地生成人造图像。
Eliot Higgins是Bellingcat的创始人,该组织利用公开的图像和视频分析当前的事件,Higgins指出,虚假的图像绝不是一个新问题。我们中的许多人仍然对照片和视频有一定的信任,而这些照片和视频并不一定要用文字来传达。Hwang认为,这项技术将演变为一种人工智能军备竞赛,让那些试图欺骗的人相互进行对抗。
Lehtinen淡化了他的研究将对网上信息传播的影响。他认为:“随着时间的推移,我们可能不得不重新思考意象的本质。”