AI系统教机器人如何在荒野小径上航行
2019年01月21日 由 童童 发表
623580
0
[caption id="attachment_35304" align="aligncenter" width="560"]
上图:SoftBank Robotic的Pepper机器人 图片来源:Alex Knight[/caption]
对于救援人员和户外运动爱好者来说,如何穿越荒野小径是一项非常实用的技能,但对机器人来讲却很难。当然,这并不是说这些机械朋友没有能力在爬上山坡的同时避开倒下的树枝,最先进的机器学习算法是可以做到这一点的。但问题在于它们缺乏通用性:人工智能驱动的机器人经常在他们“从未见过”的环境中挣扎。
科罗拉多大学(University of Colorado)的研究人员最近在预印本服务器Arxiv.org上一篇发表了一篇论文(“荒野小径上的机器人从虚拟到现实的转移学习”)中提出了一个解决方案。他们的方法是利用多种深度学习模型。这是一种模拟神经的数学功能,可以帮助机器人从摄像机镜头中判断出远足路线的方向。
研究人员写道:“机器人在许多涉及户外使用的场景中都很有前途,比如搜救、野生动物管理和收集数据以及改善环境、季节气候和天气预报等。”“然而,户外道路的自主导航仍是一个具有挑战性的问题。在许多情况下,收集和管理训练数据库也许会不太可行或不实用,尤其是在道路条件可能因季节性天气变化、风暴或自然侵蚀而改变的情况下。”
正如这篇论文的作者所提及的,户外道路存在很多变化。它们由任意数量的材料(如砾石、泥土和覆盖物)所定义,它们跨越不同的生物群落,如森林、草地和山脉。此外,它们的外观随着季节、天气和一天中的时间的变化而变化,而且它们经常被茂密的植被部分遮挡。
[caption id="attachment_35319" align="aligncenter" width="337"]
Unity环境中数据捕获的摄像头配置的自上而下视图[/caption]
收集和标记训练出一个健全而强大的系统所必需的真实数据将会是非常耗时的,因此,研究人员转而寻找虚拟户外道路的合成图像。为了制作它们,他们在Unity中组装了一个带有泥土小道的高山场景,并用Unity Asset Store中的树木、岩石和草的3D模型来点缀它。然后,他们放置了一个带有三个摄像头的虚拟机器人。每个摄像头的分辨率为400×400像素,视野为80度,可以收集20,269张景观图片。
研究小组将图像的分辨率调整为100×100×3像素,这样处理速度更快,内存消耗更低。然后他们将机器人的摄像头分成三组:一组用于培训,一组用于验证,第三组用于测试。
训练数据库被输入到三种不同结构的神经网络:深度神经网络(deep neural network, DNN)、卷积神经网络(tional neural network, CNN)和递归神经网络(regression neural network, RNN)。在人工智能完全控制虚拟机器人的实验中,RNN模型成功预测出正确的轨迹方向,准确率达到95.02%。重要的是,在另一项测试中,研究人员在4000幅现实世界图像的数据库上训练了所有三种人工智能算法,DNN模型的准确率达到58.41%,超过了基础线,表明虚拟到现实世界的转移学习有潜力超越一些传统的计算机视觉方法。
研究人员在报告中写道:“据我们观察,该机器人在包括急转弯和大圆石等障碍物在内的路径导航方面取得了很大的成功。”“此外,我们观察到几个‘明智’实例:在一次试验中,机器人在遇到一个大障碍物后,会短暂地偏离轨道,但之后又会重新回到轨道上继续其行程。
这三种神经网络的表现都不算完美。机器人偶尔会将特定的地形区域误认为是轨迹特征,从而使其偏离航线。研究人员承认,Unity的低质量地形包无法生成不同条件下的地形条件。但他们认为,这次试验为机器人地形导航AI训练的方法奠定了基础。
“机器人电池寿命,人体疲劳和安全考虑是手动数据采集的主要挑战; 然而,通过我们的方法,这些问题可能会被规避,因为标签数据的生成可以在虚拟环境中快速有效地执行,“研究人员写道。“然后,机器人可以进行虚拟训练,以驾驭难以进入和/或危险的地形,包括目前无法访问的新地形,并从(例如,火星)收集真实数据,而不会首先暴露于这些环境。”
“机器人电池的寿命、人体疲劳和安全问题是人工数据收集的主要挑战。然而,通过这次的方法,这些问题都可以避免。因为标记的数据生成可以在虚拟环境中快速高效地执行,”研究人员写道。然后研究人员还表示,机器人在未来将会接受更有挑战性的虚拟训练,以导航进入危险的地形或有更多障碍的地形。待机器人导航得到更多稳定的数据后,等待他们的将会是外太空。正如梦想永远不能止于眼前,研究人员将要瞻望更远的未来。