利用机器学习为广告生成有说服力的面孔
2018年08月09日 由 浅浅 发表
137444
0
匹兹堡大学的研究人员最近开发了一种条件变化的自动编码器,可以为广告制作独特的面孔。他们的研究基于他们以前的工作,探索了更好地理解广告的自动化方法。
“在我们过去的项目中,我们想看看机器是否可以解读广告中发现的复杂的视觉修辞,”进行这项研究的研究人员之一Christopher Thomas表示,“广告包含双关语,隐喻和其他有说服力的修辞设备,这些设备很难让机器理解。在本文中,我们不仅想了解广告,还想了解这些有说服力的内容是否可以由计算机自动生成。”
广告业的主要任务是使用有说服力的语言和图像来宣传产品或传达想法。面孔是广告的一个关键方面,通常根据所宣传的产品和传达的信息进行不同的描绘。
Thomas与Adriana Kovashka合作,利用机器学习来产生有说服力的面孔,适用于不同类型的广告。他们使用条件变化的自动编码器,或“生成模型”,机器学习模型学习生成类似于它训练的合成数据。
广告中的面孔被转换成17个不同的类别。
“在计算机视觉中,自动编码器通过拍摄图像并学习将图像表示为几个数字来工作,然后,模型的第二部分,即解码器,学会从中获取这些数字并从中再现原始图像。你几乎可以将其视为一种压缩形式,其中大图像由几个数字表示。”
当这种类型的机器学习模型在足够大的数据集上训练时,它开始表示数字内的语义方面。例如,在Thomas和Kovashka开发的模型中,一个数字将控制面部的形状,另一个数字将控制皮肤的阴影,以及其他语义特征。
但是,如果研究人员希望模型能够捕捉到一个人是否戴着眼镜,但是训练数据集中没有足够的带眼镜的人的照片,那么在重建图像时这个属性就会丢失。因此,他们开发了一个条件自动编码器,这意味着他们可以将其他数字添加到它没有单独获取的模型中,代表可能与特定广告相关的语义特征。
“这很酷的部分是,一旦我们训练模型代表100个数字的面孔,如果我们改变其中一些数字并解码它们,我们就可以改变面貌,”Thomas表示,“因此,我们可以改变现有的面部,使它们看起来相同,但具有不同的属性,例如眼镜,微笑或不微笑等等,只需改变我们的模型用来表示它们的一些数字。”
训练计算机视觉的生成模型可能是一项具有挑战性的任务,需要大型图像数据集,并且在对诸如广告等非常多样化的数据进行培训时经常会失败。Thomas和Kovashka通过使用需要较少数据的自动编码器来克服这些限制,并且可以应对广告中发现的相当大的差异。
Thomas指出,“尽管如此,因为没有足够的数据,它并不总能捕捉我们想要的概念,因此,我们故意将语义注入其表示中,从而显著改善了结果。”
他们的调查结果表明,未来广告客户将能够制作针对个人客户量身定制的定制广告。例如,他们可以生成具有与观看者的面部特征匹配的面部特征的面部,以便他们与主体识别更多。
“这种自动,细粒度的广告定制可能对在线广告商产生巨大影响,”Thomas说,“此外,不希望为其广告投放额外模型或进行手动编辑的广告客户,可能能够将现有面孔从其他广告转换为适合其广告类型的面孔。”
研究人员现在正在探索如何改进生成的图像,使其与使用大量数据生成的图像质量相匹配。要做到这一点,他们需要设计其他生成模型,这些模型在高度变化和有限的数据训练时更具鲁棒性。
Thomas表示,“另一种可能的研究方向是生成除了面孔之外的其他物品,甚至生成有意义且有趣的整个广告,这需要开发新的技术,用于在生成框架中对修辞结构进行建模,并结合文本理解和生成。”