英伟达黑科技:AI软件GauGAN,涂鸦秒变逼真风景图
2019年03月20日 由 明知不问 发表
206663
0
英伟达在GTC 2019上展示了一个令人惊叹的图像创建器。使用生成对抗性网络,该软件的用户只需点击几下,就能绘制出近乎真实感的图像,该软件将立即把几条线转化成美丽的日落景象。它就如同AI中的MS Paint。
这款名为GauGAN的软件只是证明了英伟达神经网络平台的可行性。它的设计目的是编译一幅人类如何绘画的图像,其目标是拍一张草图,然后在几秒钟内把它变成一张逼真的照片。在早期的演示中,它似乎像宣传的那样工作。
GauGAN有三种工具:油漆桶,钢笔和铅笔。屏幕底部是一系列对象。选择云对象并用铅笔绘制一条线,软件将产生一缕逼真的云。但这些不是图像印章。GauGAN产生独有的结果。画一个圆圈,用油漆桶填充,软件将使浮云变得蓬松。
用户可以使用输入工具绘制树的形状,它将生成一棵树。画一条直线,它会产生一个裸露的树干。在顶部画一个球状物,软件将用叶子填充它,最终产生一棵完整的树。
GauGAN也是多模式的。如果两个用户使用相同的设置创建相同的草图,则项目中内置的随机数确保软件创建不同的结果。
为了获得实时结果,GauGAN必须在Tensor计算平台上运行。英伟达在RDX Titan GPU平台上演示了该软件,使其能够实时生成结果。演示的操作员能够绘制一条线,软件立即产生结果。然而,应用深度学习研究副总裁Bryan Catanzaro表示,经过一些修改后,GauGAN几乎可以在任何平台上运行,包括CPU,但结果可能需要几秒钟才能显示。
在演示中,对象之间的界限并不完美,项目背后的团队表示它将会改进。有两个物体接触的轻微线条。英伟达称结果是真实的,但经过仔细审查,还是能看出来一些区别。神经网络目前在训练对象以及神经网络训练要做的事情上存在问题。该项目希望缩小这一差距。
英伟达用Flickr上的100万张图像来训练神经网络。大多数来自Flickr的知识共享,Catanzaro说该公司仅使用经过许可的图像。该公司表示,该程序可以合成数十万个对象及其与现实世界中其他对象的关系。比如改变季节,叶子将从树枝上消失。或者,如果树前有一个池塘,那么这棵树就会在水中反射出来。
Catanzaro希望这款软件可以在英伟达的新AI Playground上使用,但他说公司需要做一些工作才能实现这一目标。他认为在视频游戏中使用这样的工具可以创建更加身临其境的环境,但是英伟达没有直接构建软件。
但这类软件可以用来制作不真实的图像并用于恶意目的。Catanzaro同意这是一个重要的话题,“我们非常关心这一点,因为我们希望让这个世界变得更美好,这是一个信任问题,而不是技术问题。”
即使在这个有限的演示中,很明显围绕这些能力构建的软件将吸引所有人,从视频游戏设计师到建筑师再到休闲游戏玩家。该公司没有任何计划将其商业化发布,但很快就会公开软件让任何人都可以使用。