IBM计划提供最大的人脸识别面部数据集，用于人工智能偏见研究

2018年06月28日由浅浅发表 141392 0

社会比以往更关注人工智能系统中的偏见问题，尤其是那些用于识别和分析人脸图像的问题。IBM正在采取以下行动来确保面部识别技术的构建和负责的训练：

1）造成面部分析领域偏差的最大问题之一是缺乏用于训练系统的各种数据。因此，今年秋天，IBM将公开以下数据集作为技术行业和研究团体的工具：

由IBM Research科学家创建的超过100万张图像的面部属性和身份训练数据集，用于改善面部分析系统的训练。它将用属性和身份标注，利用来自Flickr图像的地理标签来平衡来自多个国家的数据和主动学习工具，以减少样本选择偏差。目前，可用的最大面部属性数据集包括20万张图像，因此具有一百万个图像的这个新数据集将是一个巨大的进步。此外，今天可用的数据集只包括属性（头发颜色，面部毛发等）或身份（确定5张图像属于同一人），但不是两者兼而有之。这个新的数据集改变了这一点，使单个功能可以将属性与个人进行匹配。

一个包含36000幅面部图像的数据集，包括所有种族，性别和年龄，由IBM Research进行注释，为人们提供更多不同的数据集，供用户评估其技术。这将特别有助于算法设计人员识别并解决其面部分析系统中的偏见。解决偏见的第一步是要知道存在偏差，这就是数据集所能实现的。

2）今年早些时候，IBM大幅增加了面部分析的Watson视觉识别服务的准确性，这表明面部分析的误差率降低了近10倍。而且，IBM正在继续推动持续改进。2018年9月14日结合ECCV 2018举办了一次技术研讨会（由IBM Research与马里兰大学合作），以识别和减少面部分析中的偏差。使用IBM面部图像数据集的比赛结果将在研讨会上公布。此外，研究人员继续与广泛的利益相关者，用户和专家合作，了解可能影响人工智能决策的其他偏见和漏洞，以便能够继续改进我们的系统。

人工智能拥有巨大的力量来改善我们的生活和工作方式，但前提是对人工智能系统的开发和训练负责，并产生我们信任的结果。确保系统接受平衡数据的培训，消除偏见对于实现这种信任至关重要。

随着人工智能的采用增加，防止偏差进入人工智能系统的问题正在上升到最前沿。不管多么准确的技术，都无法取代人的判断力，直觉和专业知识。像AI这样的先进创新的力量在于它们增强而不是替代人类决策的能力。因此，任何使用人工智能的组织（包括视觉识别或视频分析功能）都必须对与之合作的团队进行训练，以了解偏见，包括隐性和无意识偏见，对其进行监控并知道如何解决。

作为领导企业领域多元化和包容性的公司，任何形式的歧视都与IBM的价值观背道而驰。IBM表示，他们一直致力于确保人工智能技术的开发没有偏见。

标签：

视觉识别人脸识别 IBM

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌：计算机视觉模型可在无监督情况下跟踪对象并对视频着色

下一篇百度宣布首款L4级无人车量产，并发布全功能云端AI芯片昆仑和百度大脑3.0

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来