那个短命的一键“脱衣”软件,我在GitHub搜到了相关技术…

2019年08月06日 由 sunlei 发表 414917 0
前段时间,美国一名程序员开发的一款DeepNude的应用横空出世,绰号为“AI X光“。



只需要给它一张照片,即可借助神经网络技术,自动“脱掉”衣服。原理虽然门槛很高,但是应用起来却毫不费力,因为对于使用者来说,无需任何技术知识,一键即可获取。



从网上给出的生成结果来看,效果确实可以以假乱真



此前,名为deepfakes的 AI 换脸技术就曾在网上引发热议,遭到个平台的抵制,这款利用 AI 创建女性裸体的低俗软件,同样也招来一片骂声:





百度前首席科学家吴恩达也在推特上评价了这款应用,他认为这是人工智能最令人作呕的应用之一。



庆幸的是,这款软件在上线几个小时候,DeepNude就下线了,创建者给出的理由是:流量过高!可能会被滥用。该团队还警告称不要在网上分享这款应用,否则会违反相关服务条款。



就这样,DeepNude 的闹剧结束了。

话说回来,这样一个软件是如何创建的呢?

我在Github上搜索到一个关于DeepNude使用的图像生成和图像修复相关技术项目(由yuanxiaosc创建),这个仓库包含DeepNude的pix2pixHD(由英伟达提出)算法,更重要的是DeepNude背后的通用的Image-to-Image理论与实践研究。

Image-to-Image Demo


这一部分提供一个试玩的 Image-to-Image Demo:黑白简笔画到色彩丰富的猫、鞋、手袋。DeepNude 软件主要使用了Image-to-Image技术,该技术理论上可以把你输入的图片转换成任何你想要的图片。



在左侧框中按照自己想象画一个简笔画的猫,再点击process按钮,就能输出一个模型生成的猫。

体验地址:https://affinelayer.com/pixsrv/

DeepNude的技术堆栈




  • Python + PyQt

  • pytorch

  • 深度计算机视觉


Image-to-Image Theoretical Research


这一部分阐述DeepNude相关的人工智能/深度学习理论(特别是计算机视觉)研究,

1. Pix2Pix




Pix2Pix是伯克利大学研究提出的使用条件对抗网络作为图像到图像转换问题的通用解决方案。(Github地址:https://github.com/phillipi/pix2pix

 

2、Pix2PixHD






从语义图上获得高分辨率图片。语义图是一幅彩色图片,图上的不同色块代表不同种类物体,如行人、汽车、交通标志、建筑物等。Pix2PixHD将一张语义图作为输入,并由此生成了一张高分辨率的逼真的图像。之前的技术多数只能生成粗糙的低分辨率的图片,看起来也不真实。而这个研究却生成了2k乘1k分辨率的图像,已经很接近全高清的照片。(Github地址:https://github.com/NVIDIA/pix2pixHD

3. CycleGAN




CycleGAN使用循环一致性损失函数来实现训练,而无需配对数据。换句话说,它可以从一个域转换到另一个域,而无需在源域和目标域之间进行一对一映射。这开启了执行许多有趣任务的可能性,例如照片增强,图像着色,样式传输等。您只需要源和目标数据集。

使用CycleGAN神经网络模型实现照片风格转换、照片效果增强、照片中风景季节变换、物体转换四大功能。

4. Image Inpainting 图像修复




在演示视频中,只需用工具将图像中不需要的内容简单涂抹掉,哪怕形状很不规则,NVIDIA的模型能够将图像“复原”,用非常逼真的画面填补被涂抹的空白。可谓是一键P图,而且“毫无ps痕迹”。该研究来自Nvidia的Guilin Liu等人的团队,他们发布了一种可以编辑图像或重建已损坏图像的深度学习方法,即使图像穿了个洞或丢失了像素。这是目前2018 state-of-the-art的方法。

事实上,可能不需要Image-to-Image。我们可以使用GAN直接从随机值生成图像或从文本生成图像:

1.Obj-GAN


微软人工智能研究院(Microsoft Research AI)开发的新AI技术Obj-GAN可以理解自然语言描述、绘制草图、合成图像,然后根据草图框架和文字提供的个别单词细化细节。换句话说,这个网络可以根据描述日常场景的文字描述生成同样场景的图像。

效果



模型


2.StoryGAN


微软新研究提出新型GAN——ObjGAN,可根据文字描述生成复杂场景。他们还提出另一个可以画故事的GAN——StoryGAN,输入一个故事的文本,即可输出连环画。

当前最优的文本到图像生成模型可以基于单句描述生成逼真的鸟类图像。然而,文本到图像生成器远远不止仅对一个句子生成单个图像。给定一个多句段落,生成一系列图像,每个图像对应一个句子,完整地可视化整个故事。

效果



现在用得最多的Image-to-Image技术应该就是美颜APP了,所以我们为什么不开发一个更加智能的美颜相机呢~

技术无罪,错的是滥用技术的人,时代的发展需要技术的进步做为支撑,但更应该防止技术的不正当使用。希望以上这些技术,大家都能把它们用到正道上。

本文综合自 :https://github.com/yuanxiaosc/DeepNude-an-Image-to-Image-technology、程序猿等。

 
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消