Waymo开发用于训练AI驾驶员的系统,避免各种危机状况
2018年12月11日 由 浅浅 发表
424105
0
今年,Waymo取得了一些值得注意的进展。8月,其自动驾驶汽车行驶里程超过了1000万英里,上周还推出了自动驾驶出租车商业服务Waymo One。但是研究人员把目光投向了更长远的未来。
在今天的一篇博客文章中,研究人员Mayank Bansal和Abhijit Ogale详细介绍了一种自动驾驶训练方法,可以标记数据,即来自专业加试示范的Waymo数百万英里已标记数据,以监督的方式训练AI驾驶员(在此情境中,“监督”是指机器学习技术,其中提供输入和期望的输出数据)。
研究人员写道,“近年来,使用大量标记数据的深度神经网络的监督训练改善了许多领域的最新技术,特别是在物体感知和预测领域,这些技术被广泛应用于Waymo,随着神经网络对感知的成功,我们自然会问这样一个问题:我们能否使用纯粹的监督深度学习方法训练出技术熟练的驾驶员?”
Waymo的AI系统在模拟环境中绕过停着的汽车
为了创建一个能够模仿专业驾驶员的系统,他们精心设计了一个神经网络,名为ChauffeurNet,通过观察真实和模拟数据的组合,包括地图,周围物体,交通,过去的汽车运动,学会生成驾驶轨迹灯状态。低级控制器将十点轨迹转换为转向和加速命令,允许AI模型驾驶实体车和模拟车。
该模型样本来自约60天的专业驾驶数据,使用的技术确保它不会从过去的运动中推断,而是直接欧派对环境的变化做出实际反应。在测试中,它对诸如停车标志和红绿灯之类的交通管制做出了反应,但可以预见的是,当暴露于从未见过的情况时,它的表现不佳。
研究人员指出,造成这种情况的问题在于从现实世界驾驶中获得的演示是有偏见的,它们只包含良好情况下驾驶的例子。为了教会网络适应极端情况,团队合成了近乎意外和与对象的碰撞的情况,后者与非奖励因素搭配,鼓励AI模型避免这些情况。
模型处理转弯
ChauffeurNet在模拟环境中表现更好,考虑了损失和综合示例,甚至设法在交通灯从黄色过渡到红色时停下,并修复其轨迹的微小偏差。当用于在现实世界的私人试车道上驾驶Waymo的Chrysler Pacifica小型货车时,它成功地沿着弯曲的车道行驶,对于停车标志和转弯处理得当。
研究人员写道:“全自动驾驶系统需要处理现实世界中发生的事件的能力。在Waymo车辆上运行的计划器将机器学习和明确推理的组合,用来不断评估大量可能性,并在各种不同情况下做出最佳驾驶决策。因此,完全由机器学习的系统取代Waymo计划器的门槛非常高,尽管来自这样一个系统的组件可以在Waymo计划器中使用,或可用于在计划器的模拟测试期间创建更现实的智能体。”
论文:sites.google.com/view/waymo-learn-to-drive