精确实时地预测附近车辆的移动或行人的未来轨迹对于安全的自动驾驶至关重要。香港城市大学(City University of Hong Kong,简称CityU)的一个研究团队最近开发了一种新颖的人工智能系统,提高了在拥挤交通中的预测准确性,并将计算效率提升超过85%,极大地提升了自动驾驶车辆的安全性。
该研究的负责人、CityU计算机科学系的王建平教授解释了精确实时预测在自动驾驶中的重要性,强调即使微小的延迟和错误也可能导致灾难性事故。
然而,现有的行为预测解决方案往往难以正确理解驾驶场景,或者在预测中缺乏效率。这些解决方案通常涉及当车辆及其观察窗口向前移动时,重新对周围物体和环境的最新位置数据进行重新规范化和重新编码,即使最新的位置数据与之前的数据有很大重叠。这导致冗余计算和实时在线预测的延迟。
为了克服这些限制,王教授及其团队提出了一种突破性的轨迹预测模型,名为“QCNet”。该模型基于相对时空位置原理,具有卓越的性能,如"空间维度上的旋转平移不变性"和"时间维度上的平移不变性"。
这两个性质使得从驾驶场景中提取的位置信息在观察者的时空坐标系下是唯一且固定的,无论观察者如何观察驾驶场景。这种方法允许缓存和重复使用先前计算的坐标编码,使预测模型在理论上能够实时操作。
团队还将道路使用者、车道和人行道的相对位置纳入到AI模型中,以捕捉驾驶场景中它们之间的关系和交互。这种对交通规则和多个道路使用者交互的加强理解使得该模型能够生成符合地图规范且无碰撞的未来轨迹,同时考虑到道路使用者未来行为的不确定性。
为了评估QCNet的有效性,团队使用了“Argoverse 1”和“Argoverse 2”两个大规模的开源自动驾驶数据集和高清地图,这些数据集被认为是行为预测的最具挑战性基准,包括超过32万个数据序列和25万个场景。
在测试中,QCNet在预测道路使用者未来动向方面既快速又准确,即使长期预测时间长达6秒。它在Argoverse 1上的333种预测方法和Argoverse 2上的44种预测方法中排名第一。此外,在涉及190个道路使用者和169个地图多边形(如车道和人行横道)的最密集交通场景中,QCNet将在线推理延迟从8ms显著降低到1ms,并将效率提高了85%以上。
"将这项技术整合到自动驾驶系统中,自动驾驶车辆可以有效地理解周围环境,更准确地预测其他使用者的未来行为,并做出更安全、更接近人类决策的决策,为安全的自动驾驶铺平道路"王教授说道。"我们计划将这项技术应用于更多自动驾驶应用中,包括交通仿真和类似人类的决策制定。"
这项研究结果于2023年在加拿大举办的IEEE/CVF计算机视觉与模式识别会议(CVPR 2023)上以“Query-Centric Trajectory Prediction”为题目进行了发布。