DeepMind开源Psychlab,将人工智能与心理学联系起来
2018年01月29日 由 yuxiangyu 发表
191013
0
想一想像购物这样的简单任务。如果你没法拿起你的购物清单上的商品,这可以告诉我们关于你的大脑的什么功能?它可能表明在搜索列表中的商品时,你无法将注意力从一个商品转移到另一个商品上。这可能表明记住购物清单的困难。或者两者都有。
看起来单一的任务实际上依赖于多种认知能力。我们在人工智能研究中也面临类似的问题,在这种情况下,任务的复杂性往往会使智能体取得成功所需的单个技能难以分离。但是了解智能体特定的认知技能可能会对改善其整体表现有用。
为了解决人类的这个问题,心理学家在过去的150年里设计了严格控制的实验,目的是隔离一个特定的认知能力。例如,他们可能会使用两个独立的测试来分析超市的场景 - 一个“视觉搜索(visual search)”测试,它需要被测者在一个图案中查找一个特定的形状,可以用来探测注意力,他们可能会要求一个人回想研究列表中的商品来测试他们的记忆。
我们认为可以使用类似的实验方法来更好地理解人造智能体的行为。所以我们开发了Psychlab这个建立在
DeepMind实验室的平台,它使我们能够直接运用认知心理学等领域的方法来研究受控环境下人造智能体的行为。今天,我们开放这个平台供其他人使用。
Psychlab重现了虚拟DeepMind Lab环境中通常用于人类心理学实验的设置。这通常包括坐在电脑显示器前使用鼠标来响应屏幕上任务的参与者。同理,我们的环境允许虚拟主体在虚拟计算机显示器上执行任务,使用它的注视方向进行响应。这使人类和人工因素使用相同的测试,最小化实验差异。也使得它更容易与认知心理学的现有文献联系起来,并从中获得思路。
随着Psychlab的开源版本的发布,我们构建了一系列在虚拟计算机监视器上运行的经典实验任务,并且它们具有灵活且易于学习的API,使其他人能够构建自己的任务。
- 视觉搜索 -测试搜索目标物品数组的能力。
- 连续识别 - 为越来越多的项目测试内存。
- 任意视觉运动学映射 -测试刺激反应回忆的配对。
- 更改检测 - 检测延迟后重新出现的对象数组中变化的能力。
- 视觉锐度和对比敏感度 -检测识别小对比度和低对比度刺激的能力。
- 玻璃图案检测 -测试全局形式的感知。
- 随机点运动判别 -检测相干运动的能力。
- 多个对象跟踪 -测试随着时间的推移跟踪移动对象的能力。
每一项任务都经过验证,证明我们的人类结果与认知心理学文献中的标准结果是一致的。
以“视觉搜索”任务为例。在复杂的刺激物中定位物体的能力,比如超市货架上的一件物品,已经被研究作为一种理解人类选择性注意的方法。
[video width="358" height="360" mp4="https://www.atyun.com/uploadfile/2018/01/videoplayback-5.mp4"][/video]
当人们被赋予“在水平条之间搜索竖直条”和“在各种颜色的条之间搜索粉条”的任务时,其反应时间不会根据屏幕上的条数量而改变。换句话说,他们的反应时间是“固定大小”。然而,当任务是在不同形状和不同颜色条中搜索粉条时,人的反应时间每增加一个条就会增加大约50ms。当人类在Psychlab上完成这个任务时,我们复制了这个结果。
这张图片说明了在Psychlab的视觉搜索任务上人类和人造智能体反应时间的差异
当我们对一个最先进的人造智能体进行相同的测试时,我们发现它虽然可以执行任务,但显示反应时间的结果并不是人类模式。在这三种情况下,他们用了相同的时间来应对。对于人类而言,这些数据暗示了
并行和串行关注的区别。智能体似乎只有并行机制。识别人类与我们目前的人造智能体之间的这种差异,为未来改善智能体设计提供了思路。
Psychlab被设计为认知心理学、神经科学和人工智能之间的桥梁。我们将其开源,已期更多的研究群体能够在他们的研究中利用它,并帮助我们塑造未来。