生成性对抗网络:GANs的由来及其特点
2019年12月28日 由 TGS 发表
320192
0
人工智能能够产生类似人类的语言,或者生成难以从现实生活中照片中区分出来的人图像。通常情况下,这些系统建立在可生成的对抗网络(GANs)的基础上,GANs是由两部分组成的人工智能模型,包括一个创建样本的生成器和一个试图区分生成样本和真实样本的鉴别器。这种独特的安排使GANs能够实现令人印象深刻的媒体合成壮举,从创作旋律、用羊换长颈鹿,到让人产生幻觉的滑冰运动员和足球运动员的镜头。事实上,正是由于这种能力,GANs被用来制作有问题的内容,比如deepfakes,这是一种媒体工具,它可以把一个人放在现有的媒体中,并将其替换为其他人。
Facebook人工智能研究主管Yann LeCun将GANs的进化称为本世纪最有趣的想法,尽管有些漫长和曲折,且有些不足之处,但是GANs仍然是当今使用的最通用的神经网络架构之一。
让两种算法相互竞争的想法起源于阿瑟·塞缪尔,他是计算机科学领域的杰出研究人员,被认为普及了“机器学习”这个术语。在IBM工作期间,他设计了一款跳棋游戏——“塞缪尔跳棋游戏”这是最早实现成功自学的游戏之一,部分方法是通过估计双方在特定位置获胜的几率。后来,谷歌大脑研究科学家、苹果特别项目组机器学习主任伊恩•古德费洛和同事在2014年,发表了一篇开创性的研究论文,题为《生成式对抗网络》,这标志着生成性网络的正式诞生。
GANs以一种无监督的方式进行训练,这意味着它能在不参考已知、标记或注释结果的情况下推断数据集中的模式。有趣的是,鉴别器的工作通知了生成器——每当鉴别器正确地识别出一个合成的工作时,它就告诉生成器如何调整它的输出,以使它在将来更加真实。
实践中,GANs由于架构问题而存在许多缺点。生成器和鉴别器模型的同时训练在本质上是不稳定的。有时参数会振荡或不稳定,这并不奇怪,因为每次更新参数之后,所解决的优化问题的性质都会发生变化。另一种情况是,生成器崩溃,并开始生成在外观上基本相同的数据样本。此外,生成器和鉴别器也有互相压倒对方的危险。如果生成器变得太精确,它就会利用鉴别器中的弱点生成不好的结果,而如果鉴别器变得太精确,它就会阻碍生成器朝着收敛的方向前进。