Deepmind重大突破:训练AI学习人类大脑导航技巧
2018年05月10日 由 浅浅 发表
34136
0
英国研究人员团队开发了一个人工智能项目,可以学习在迷宫里走捷径以实现目标。在这一过程中,程序开发出类似人脑的结构,学习导航技巧。
Nature杂志中描述了这些计算性质的“网格单元”,它们可以帮助科学家为未来的机器人设计更好的导航软件,甚至提供探索哺乳动物大脑奥秘的新途径。
近年来,人工智能研究人员开发并优化了深度学习网络的分层程序,可以提出新颖的解决方案来实现其指定的目标。例如,一个深度学习网络可以判断哪些面孔可以在一系列不同的照片中识别,并且通过几轮训练调整算法,直到它每次都能找出正确的面部。
约翰霍普金斯大学的神经科学家Francesco Savelli表示,这些网络受到大脑的启发,但它们的工作方式并不相近。到目前为止,人工智能系统并不能模拟大脑的结构,真实神经元的多样性,单个神经元的复杂性,甚至是学习的规则。
“人们认为,大部分的学习都随着这些突触的加强和减弱而发生,”Savelli在接受采访时说道,他指的是神经元之间的联系。“这些人工智能系统也是如此。但你究竟如何去做,以及管理这种学习的规则这些方面对于大脑和这些系统可能会有很大的不同。”
无论如何,人工智能对于面部识别,破译手写和翻译等诸多功能都非常实用。但是对于更高层次的活动,比如在复杂的环境下导航,还有很长的路要走。
我们的大脑在没有意识努力下表现出导航的一个方面是路径集成。哺乳动物使用这个过程通过考虑他们所走过的距离和他们面对的方向,来重新计算他们在每走一步之后的位置,这是大脑产生其周围的地图能力的关键。
与这些“认知地图”相关的神经元包括:定位细胞,当它们的主人处于环境中的某个特定位置时点亮;头部方向细胞,告诉他们面对的方向;网格单元,这似乎是在周围地形上对一个假想六边形网格的响应。这些网格单元似乎响应映射到周围地形上的假想六边形网格。每当踩在这个网格中的“节点”时,神经元就会点亮。
“网格细胞的具有几何特性的认知地图有助于规划和跟踪轨迹,”Savelli和约翰霍普金斯神经科学家James Knierim在论文评论中写道。网格细胞的发现使三位科学家获得了2014年诺贝尔生理医学奖。
人类和其他动物在空间中移动几乎没有什么问题,因为所有这些高度专门化的神经元结合起来,告诉我们所在的位置以及接下来要去哪里。
谷歌的DeepMind和伦敦大学学院的科学家们想开发一个可以执行路径集成的程序。所以他们通过模拟啮齿动物寻找食物的路径来训练网络。他们还为它提供了啮齿动物的运动和速度数据,以及模拟地点细胞和头部方向细胞的反馈。
[video width="640" height="360" mp4="https://www.atyun.com/uploadfile/2018/05/Video-One-1.mp4"][/video]
在这次训练期间,研究人员发现了一些奇怪的情况:模拟的啮齿动物似乎开发出了类似于网格单元的活动模式,尽管网格单元并不属于他们的训练系统。
Savelli和Knierim表示,“类网格单元的出现令人印象深刻,这个例子很好地表达了深度学习能做到最好的事情:创造一个原始的,通常是不可预测的内部表征来解决任务。”
网格细胞似乎对路径集成非常实用,以至于这个人造啮齿动物想出的解决方案与真正的啮齿动物能想出的非常相似。研究者进一步的疑问是:网格细胞能否在哺乳动物导航的另一个关键方面发挥作用?
这一方面即基于矢量的导航,基本上就是指计算直线路径的能力,即使最初选择了一条更长更迂回的路线,但是仍能直线抵达目标。这是找到捷径的有用技巧。
为了验证这一点,研究人员让网格细胞驱动的人造啮齿动物进行挑战,以解决迷宫问题,但是阻挡了大部分通路,因此程序必须经过很长的路线才能抵达目标。于是修改了该计划,只要更接近目标的行动都可获得奖励。他们在给定的迷宫中训练网络,然后开放捷径观察会发生什么。
带有网格细胞的模拟啮齿动物很快找到并使用了捷径,尽管这些路径是全新且未知的。而且它的表现远远好于一个人造啮齿动物,其起点和目标点仅由位置细胞和头部方向细胞追踪。它甚至击败了“人类专家”。
这些发现最终可能对于机器人在未知领域的发展很重要。从神经科学的角度来看,这可以帮助研究人员更好地理解神经元如何在哺乳动物大脑中发挥作用。
当然,与其生物副本相比,该程序高度简化。在模拟的啮齿动物中,“位置细胞”没有改变,虽然在人脑中位置细胞和网格细胞以复杂的方式相互影响。
通过开发网络可以用类似网格的输入来调整位置细胞层,那么这种关系就可以逐渐被破解。进一步开发AI程序可以帮助科学家理解在活体神经系统中发挥作用的所有复杂关系。通过深度学习系统更简单地理解人类的推理过程,也是一个十分令人兴奋的挑战。