一项声称人工智能可以从面部图像中推断性取向的研究在2017年秋天引起了轩然大波。两个主要的LGBTQ(女同性恋者(Lesbians)、男同性恋者(Gays)、双性恋者(Bisexuals)与跨性别者(Transgender)的英文首字母缩略字)组织,人权运动(Human Rights Campaign)和同性恋者反诋毁联盟(GLAAD)立即将这项研究贴上“垃圾科学”的标签。去年,中国的两名计算机科学家在网上发表了一篇非同行评议的论文,他们认为人工智能算法能对“罪犯”进行正确的分类,并且准确率达到了近90%。然后,一些科技初创公司也开始涌现,声称他们可以从面部图像中分析出人们的性格特征。
每个时代的从业者都在利用这个时代的新方法来研究人类的面相。在19世纪,利用人类学和心理学;在20世纪,利用遗传学和统计分析;而在21世纪,我们开始利用人工智能。
在2016年晚些时候,推动研究面相学的论文似乎远远超出了科技和学术界的主流,但就像在其他领域一样,最近感觉像是一个必须得到解决的、处于边缘位置的问题。
研究人员对他们的“性取向检测器”进行了训练和测试,使用了35,326张来自美国社交网站的公共资料。在样本中,男女同性恋者、直男和直女的合成图像揭示了大量关于该算法可用的信息:很明显,这四张合成的面孔是有区别的。主要的区别在于面相,这意味着性取向倾向于一种典型的面部结构。然而,我们可以看到,其中一些差异更显而易见。例如,直女似乎有眼影,而女同性恋则没有。眼镜这一特征在男同性恋者中很明显,在女同性恋者中也很明显,而在直男直女组合中似乎没有。或许,这种算法的识别能力与面部结构没有多大关系,但这是否和人的仪表、表现和生活方式有关?
我们使用了亚马逊的Mechanical Turk众包平台对8000名美国人进行了一项调查,看看我们是否能独立地确认这些模式。首先,我们对这些人询问了77个问题,比如“你是否喜欢画眼影?”“你戴眼镜吗?”“你有胡子吗?”以及关于性别和性取向的问题。研究结果显示,女同性恋者确实比直女更少地使用眼影,男同性恋者和女同性恋者都戴着眼镜,而年轻的直男可能比男同性恋者拥有更显著的面部毛发(胡子)。
根据被调查者的年龄来划分答案,可以提供比任何单一统计数据更丰富、更清晰的数据。在下面的数据中,我们展示了对平均年龄超过6岁的女性在“你曾经用过化妆品吗?”(上)和“你画眼影吗?”(下)这两个问题上回答“是”的比例:
蓝色曲线代表直女;氰蓝色曲线代表那些对“你会被同性吸引吗”或“你对女人有好感吗?”这样的问题回答“是”的女性。红色曲线代表的是那些对“你是同性恋吗?”这个问题回答“是”的女性。每个曲线周围的阴影区域显示了68%的置信区间。这里展示的模式是直观的;对大多数女性来说,直女往往比女同性恋者或对同性有好感的女性更爱化妆。另一方面,这些曲线也向我们展示了这些刻板印象是如何被打破的。
大多数会被同性吸引的男性都比直男更爱戴眼镜,可能这一点不太容易被观察到,但这一趋势也同样明显:
一位面相术的拥护者可能会认为,这与这些人的视觉敏锐度有关。然而,问这样一个问题:“你喜欢戴眼镜的样子吗?”这可能更像是一种风格上的选择: 会被同性吸引的女性也更喜欢戴眼镜,而且随着年龄的增长这一趋势也在增长:
我们还可以看到,在40岁以下的女性中,直女比会对同性产生好感的女性戴隐形眼镜的比率要多得多,尽管她们的视力缺陷大致相同,这进一步说明了这种差异是如何被审美偏好所驱动的:
类似的分析显示,年轻的对同性有好感的男性的面孔比直男的毛发要少得多(在我们的图中,“面部毛发”被定义为那些有“山羊胡子”、“络腮胡子”或“小胡子”而不只是有“胡茬”的人)。总体而言,在我们的样本中,直男比对同性有好感的男性有面部毛发的可能性高出35%,而对于31岁以下的男性,这一比例上升到75%。
男同性恋者大多数没有络腮胡子和小胡子可能与缺乏雄性激素(男性荷尔蒙)有关,这导致了女性化的效果。
但是,这张关于“同性恋文化”的照片,打破了男同性恋者天生就有稀疏的面部毛发的观点。
此外,在上面提到的照片中,直男的合成照片似乎比其他三张合成照片看起来皮肤更黑。我们的调查证实,直男比那些对同性有好感的男性皮肤晒黑的频率要高得多。
虽然面部图像的亮度可能是由许多因素驱动的,但之前的研究发现,睾丸激素会刺激黑细胞的结构,并导致皮肤颜色变暗。然而,一个更简单的问题是:“你在户外工作吗?”
总的来说,直男在户外工作的可能性增加了29%,而在31岁以下的男性中,这一比例上升到39%。先前的研究发现,暴露在阳光下会使皮肤变黑。
这些结果都不能证明性取向没有生理基础;事实上,大量的证据表明,我们的定位远比选择一种生活方式要深刻得多。美国外科医生David Satcher在2001年的一份报告中写道,“性取向通常是在青春期决定的,而且没有有效的科学证据表明性取向可以改变”。如果我们深入研究人类的生理和神经科学,我们最终会找到可靠的关联,甚至可能是性取向的起源。在我们的调查中,我们还发现了一些表面上可见的与非文化相关的关联的证据:也许最引人注目的是,在女同性恋者中,个子非常高的女性比例过高。然而,尽管这看上去很有趣,但它远不能很好地预测女性的性取向。
测量“人工智能同性恋雷达”的有效性的方式等同于选择一个异性恋和同性恋的面孔,这两种方法都是在训练过程中“被提出”的数据,并询问算法多久能正确地猜出哪个是哪个。随机几率为50%。对于女性来说,猜测出两者之中个子高的那个人是女同性恋者,只有51%的准确率——勉强高于随机的几率。这是因为,尽管具有统计意义证明女同性恋人群中个子高的女性比例较高,但绝大多数女同性恋者的身高并不是特别高。
相比之下,男同性恋者和女同性恋者的表现分别为81%和71%,这个结果似乎令人感到惊讶。但是,考虑一下,我们可以在一些简单的模型基础上得出类似的结果,这些模型仅仅基于一些关于演示的调查问题。例如,有两名女性,其中一名是女同性恋者,如果两个人都有眼影或都没有眼影,那就扔一枚硬币;你就有了50%的概率猜对。如果其中一人画了眼影,那么你猜这个人是直女,而另一个人是女同性恋的算法就有了平均63%的准确率。如果在此基础上再加上6个额外的问题(“你曾经用过化妆品吗?”“你有长头发吗?”“你有短头发吗?”“你用过彩色唇膏吗?”“你喜欢戴眼镜的样子吗?”和“你在户外工作吗?”)会使你的准确率提高到70%。
如果对图像质量、表情和仪容的细微偏见可以被人类发现,那么这些偏差也可以通过人工智能算法检测出来。合成照片的主要差异与脸型有关,男同性恋者的脸更“女性化”(更窄的下巴,更长的鼻子,更大的额头),而女同性恋的脸则更“男性化”(更大的下巴,更短的鼻子,更小的额头)。由于男同性恋者的面部毛发较少,而直男的肤色较深,这一机制在发育过程中是性别非典型的激素曝光。这与19世纪的同性恋“性倒错”(sexual inversion)模式相似。
更有可能的是,直男倾向于从稍微低一点角度自拍,这将会明显地增加下巴、缩短鼻翼、缩小前额、减少微笑的效果(见下面的自拍)。另一方面,正如一位婚礼摄影师在她的博客中提到的,“当你从上面拍摄的时候,你的眼睛看起来更大,这通常是很吸引人的——尤其是对女性来说。”
当一张脸从下面的角度被拍下来时,鼻孔是突出的,而较高的拍摄角度则不那么突出,并且最终完全隐藏了。再看一下合成的图像,我们可以看到直男的脸比男同性恋者有更明显的暗点,而对女性的脸则相反。正如婚礼摄影师所说的那样,直男喜欢从下面的角度拍,直女喜欢从上面的角度拍。而男女同性恋喜欢直接从前面拍。
总之,我们已经展示了在自拍中,同性恋者和非同性恋者之间明显的不同之处与打扮、表现和生活方式有关——也就是文化差异,而不是面部结构。这些差异包括:
对于这些变量,只有少数的几个可以在猜测方向上做得很好。因此,至少在这一点上,我们很难相信人工智能在某种程度上是基于我们面部结构细微而不可改变的细节来识别面相的。