算法没有偏见,我们有!

2018年01月12日 由 nanan 发表 384651 0
算法没有偏见,我们有!

对使用AI来改进组织的运作感到兴奋吗? 对计算机模型的见解和预测的承诺感到好奇吗?我想提醒大家有关偏见的问题,以及这些类型的项目如何出现,我将分享一些说明性的例子,以及关于“算法偏见”的最新学术研究。

首先,语言很重要。我们所谓的事物塑造了我们对它们的理解。这就是为什么我试图避免 “AI”这一被炒作的术语。大多数被称为“机器学习”的项目实际上被描述为“机器学习”。机器学习可以被描述为训练计算机做出决定的过程。这篇文章描述了为什么你需要担心机器学习问题中的数据。

这在很多方面都很重要。“算法偏见”现在已经在媒体上出现了。这个词是什么意思?算法正在使用歧视性的建议供法官使用;算法在对翻译服务的性别刻板印象中进行bakes;算法推动观众在YouTube上观看极端主义的视频。我认识的大多数人都认为这不是我们想要的世界。让我们深入探究为什么会发生这种情况,并且把责任归咎于它。

你的机器正在学习,但是谁在教导它呢?

物理学对我来说很难。更糟的是,我认为我永远不会擅长物理。我把这些都归功于一个可怜的高中物理老师。另一方面,虽然我不擅长复杂的数学,但我更喜欢学习它。我把这种持续的热情追溯到我的初中数学老师,他带着兴奋的心情向我们介绍了这个话题。

这个故事说明:老师很重要。这在机器学习中更加如此,机器不会带来先前的经验、背景信念以及其他所有使人类学习的重要内容,并提供许多路径到内容中。机器只能从你所展示的东西中进行学习。

所以在机器学习中,重要的问题是“教科书是什么”和“谁是老师”。“机器学习的教科书是你向软件展示的“训练数据”,教导他们如何做决定。这通常是你检查过的一些数据,并标有您想要的答案。通常情况下,你得到的数据来源非常广泛(我们通常称之为“语料库”)。如果你想预测一个人获得小额贷款的可能性有多大,那么你可能会选择一些培训数据,包括当前贷款对象的还款记录。

第二部分是关于老师是谁。老师决定要问什么问题,并告诉学生什么是重要的。在机器学习中,教师负责“特征选择”——决定机器可以用来做决定的数据有哪些部分。有时,这种特性选择是你所拥有的,而不是您所拥有的训练集所包含的。更常见的情况是,您使用一些统计数据来让计算机选择最有可能有用的特性。回到我们的小额贷款例子:一些候选特征可能是贷款期限、总金额、接收者是否有手机、婚姻状况或他们的种族。

训练数据和训练特性是任何机器学习项目的核心。

算法是镜像

让我们回到语言这个问题上来。也许一个更有用的术语是“机器学习”将是“机器教学”。这将把责任放在老师的身上。如果你在做“机器学习”,那么你最感兴趣的是它正在学什么。用“机器教学”,你最感兴趣的是你教机器做什么。这在语言上是一个细微的差别,但在理解上却有很大的不同。

把责任放在老师身上可以帮助我们意识到这个过程是多么的困难。还记得我开始时的偏见例子吗?这种量刑算法是歧视性的,因为它是由美国法院系统的量刑数据教导的,这些数据显示,除了黑人之外,对每个人都很宽容。在性别刻板印象中,bakes的翻译算法很可能是用新闻或文学的数据来教导的,这是我们在过时的性别角色和规范中发现的。 这种在您的Feed上显示虚假故事的算法被教导分享许多其他人共享的内容,无论其准确性如何。

所有这些数据都是关于我们的。

算法没有偏见,我们有!算法是镜像。

它们反映了我们的问题和数据的偏差。这些偏见会被纳入机器学习项目中,包括特征选择和训练数据。这是对我们,而不是电脑。

矫正镜头

那么我们如何检测和纠正这个呢?老师对学生的学习负有责任和自豪感。机器学习模型的开发人员应该感到类似的责任,也许也应该让他们感到类似的自豪感。

微软在公开的语言模式中努力消除性别偏见的例子让我感到振奋。我喜欢Joy Buolamwini的努力,她将这一问题重新定义为“正义”在社会和技术干预中的问题,她称之为“算法正义联盟”。ProPublica的调查性报道让公司对其歧视性的量刑预测负责。令人惊叹的Zeynep Tufekci在演讲和写作引领着整个社会的危险。凯西·奥尼尔的数学毁灭武器记录了这一事件的种种影响,为整个社会敲响了警钟。像法律这样的领域正在辩论算法驱动的决策在公共政策环境中的意义。城市法令正在开始处理如何立法反对我所描述的一些影响的问题。

这些努力有望成为这些算法镜像的“矫正镜头”——解决我们在自己的思考中看到的令人不安的方面。这里的关键是要记住,我们要做些什么来解决这个问题。使用算法确定决策不会自动使其可靠和可信; 就像对数据进行量化一样,并不会自动使之成为现实。我们需要看到我们自己在这些算法镜像中的反映,并确保我们看到我们希望看到的未来。
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消