专访初速度科技团队核心成员：博世加速器初战告捷，创始人披露自动驾驶方案进展

9月20日，经过两个月的内部筹备，首批入驻博世“汽车上的人工智能”加速器项目的15家中国初创企业在上海递交了阶段性成绩单。致力于“打造自动驾驶大脑”的新锐技术公司Momenta是其中之一。据新智驾之前报道，Momenta成立于2016年9月，成立两个月后完成500万美元A轮融资，今年7月完成4600万美元B轮融资。

而此次参与博世长达两个月的加速器流程后，Momenta研发总监兼联合创始人任少卿告诉新智驾，双方已经在汽车行业的深度需求磨合上有了更加落地的成果。

如今，从博世加速器和Momenta方面透露的状态看，Momenta已经从博世加速器项目中磨合到了更加切中汽车行业的专业产品需求和落地方案。

也是借由这个机缘，新智驾致信采访了Momenta CEO兼联合创始人曹旭东，并在博世加速器活动现场当面专访Momenta研发总监兼联合创始人任少卿，就Momenta加入博世加速器的合作细节及公司后续进展交流。本文来自对专访内容的整理编辑。

Q：创立Momenta的初衷和目前的公司定位分别是？

曹旭东：Momenta的定位是打造自动驾驶大脑，核心技术是基于深度学习的环境感知、高精度地图和驾驶决策。我们公司在整个产业链中是供应商的角色，是Tier 1或Tier 2，主要服务的客户是车厂，也就是OEM。

我们来打造自动驾驶大脑，然后和OEM共同把自动驾驶大脑和身体结合起来实现自动驾驶。

公司选择做这个方向，主要有两方面原因。

第一，这件事够大：无人驾驶技术是一项颠覆性的技术，它会彻底改变整车制造业、汽车后市场，以及出行和物流行业。未来10到20年将会是汽车相关行业的大变革，能够参与其中是一件非常激动人心的事情。

另外一方面，这件事情够难：无论感知/地图/决策的人工智能问题，还是软硬件工程落地问题，还有大规模的测试保证安全性的问题。现在仍没有一个成熟的、可量产的解决方案，这些问题值得我们探索。

Q：Momenta在自动驾驶（无人驾驶）的技术落地和商业化上是如何思考的？

曹旭东：开始做无人驾驶时，我们首先回顾了行业内的标杆企业Google。Google从2009年开始做无人驾驶至今已经积累了800万英里的路测里程，但是这些数据仍然没办法支持Google无人驾驶实现商业化。其实像Tesla，在1.2亿英里里程都没有发生任何事故，但一起事故就造成了非常非常严重的问题。

回到路测里程上，无人驾驶要做到什么样的水平呢？无人驾驶最关键的问题是什么呢？我们的答案是安全性。如果无人驾驶系统要鲁棒地达到人类的安全性，我们的评估是需要100亿公里的数据，如果安全性要超过人类驾驶安全性一个量级，需要1000亿公里的数据。

基于此，Momenta看好并已经践行了数据众包的方式，可大大降低硬件成本和数据采集成本。当然，数据众包不能损害消费者利益，尤其不能危害消费者的安全。我们可以通过影子测试，比较司机的真实驾驶行为和自动驾驶大脑的预测行为，发现自动驾驶大脑的问题，并且加以改进。影子测试不需要介入车辆控制，不会给司机带来安全风险。

Q：在数据众包上，Momenta具体是如何操作的？

曹旭东：无人驾驶的众包，简单来说需要两方面数据：第一方面是X，也就是环境数据；另一方面是Y，也就是驾驶行为数据。

无人驾驶的决策（Planning），数学一点讲，就是学习从X到Y的映射，通俗一点讲，就是遇到不同驾驶情况（环境数据），如何开车。如果有足够的X和Y成对的数据，我们就可以通过数据驱动的方式去学习无人驾驶决策。

1、环境数据

环境数据可以分成两部分：第一部分是实时感知，第二部分是高精地图。

首先是感知，我们用视觉的方式来做3D感知。

比如识别车道线、稳定精确的车辆3D框，同时有每辆车的车辆ID，每个ID都带有这辆车的类型信息，是小轿车、还是SUV、还是货车等等。又如我们识别可行驶区域，将2D识别的结果投影到3D上，基于此可以做一些实时、动态的Planning。在3D空间中，我们知道每辆车的位置、每辆车的速度，以及通过历史的数据和当前车的状态去判断它下一个时刻可能发生的运动轨迹和位置。

Q：创立Momenta的初衷和目前的公司定位分别是？

曹旭东：Momenta的定位是打造自动驾驶大脑，核心技术是基于深度学习的环境感知、高精度地图和驾驶决策。我们公司在整个产业链中是供应商的角色，是Tier 1或Tier 2，主要服务的客户是车厂，也就是OEM。

我们来打造自动驾驶大脑，然后和OEM共同把自动驾驶大脑和身体结合起来实现自动驾驶。

公司选择做这个方向，主要有两方面原因。

第一，这件事够大：无人驾驶技术是一项颠覆性的技术，它会彻底改变整车制造业、汽车后市场，以及出行和物流行业。未来10到20年将会是汽车相关行业的大变革，能够参与其中是一件非常激动人心的事情。

另外一方面，这件事情够难：无论感知/地图/决策的人工智能问题，还是软硬件工程落地问题，还有大规模的测试保证安全性的问题。现在仍没有一个成熟的、可量产的解决方案，这些问题值得我们探索。

Q：Momenta在自动驾驶（无人驾驶）的技术落地和商业化上是如何思考的？

曹旭东：开始做无人驾驶时，我们首先回顾了行业内的标杆企业Google。Google从2009年开始做无人驾驶至今已经积累了800万英里的路测里程，但是这些数据仍然没办法支持Google无人驾驶实现商业化。其实像Tesla，在1.2亿英里里程都没有发生任何事故，但一起事故就造成了非常非常严重的问题。

回到路测里程上，无人驾驶要做到什么样的水平呢？无人驾驶最关键的问题是什么呢？我们的答案是安全性。如果无人驾驶系统要鲁棒地达到人类的安全性，我们的评估是需要100亿公里的数据，如果安全性要超过人类驾驶安全性一个量级，需要1000亿公里的数据。

基于此，Momenta看好并已经践行了数据众包的方式，可大大降低硬件成本和数据采集成本。当然，数据众包不能损害消费者利益，尤其不能危害消费者的安全。我们可以通过影子测试，比较司机的真实驾驶行为和自动驾驶大脑的预测行为，发现自动驾驶大脑的问题，并且加以改进。影子测试不需要介入车辆控制，不会给司机带来安全风险。

Q：在数据众包上，Momenta具体是如何操作的？

曹旭东：无人驾驶的众包，简单来说需要两方面数据：第一方面是X，也就是环境数据；另一方面是Y，也就是驾驶行为数据。

无人驾驶的决策（Planning），数学一点讲，就是学习从X到Y的映射，通俗一点讲，就是遇到不同驾驶情况（环境数据），如何开车。如果有足够的X和Y成对的数据，我们就可以通过数据驱动的方式去学习无人驾驶决策。

1、环境数据

环境数据可以分成两部分：第一部分是实时感知，第二部分是高精地图。

首先是感知，我们用视觉的方式来做3D感知。

比如识别车道线、稳定精确的车辆3D框，同时有每辆车的车辆ID，每个ID都带有这辆车的类型信息，是小轿车、还是SUV、还是货车等等。又如我们识别可行驶区域，将2D识别的结果投影到3D上，基于此可以做一些实时、动态的Planning。在3D空间中，我们知道每辆车的位置、每辆车的速度，以及通过历史的数据和当前车的状态去判断它下一个时刻可能发生的运动轨迹和位置。

如上图中，有很多小的三角形成的轨迹，这些轨迹实际上是车上的摄像头所在的位置和姿态。因为摄像头和车是固定在一起的，如果知道了摄像头的位置和姿态，车的位置和姿态也就确定了。我们通过这种方式获得这辆车的轨迹，了解这辆车每一时刻的位置、每一时刻的速度和加速度。

Q：众包之后的训练方案是怎样的？

曹旭东：通过众包，我们可以做影子测试。

一方面，我们在高精度地图中记录人类司机的驾驶行为，另一方面，通过视觉实时感知和高精地图定位，获得环境数据，通过自动驾驶大脑的决策模型，输出一个预测行为。下一步，比对真实行为和预测行为，我们可以在不介入控制的情况下，实现影子测试。

影子测试有两点优势。一方面可以低成本地、没有危险地帮助我们测试自动驾驶大脑；另一方面，也可以支持渐进的产品升级路径。

假设一辆车装了8个摄像头、6个毫米波雷达，在刚刚出厂的时候，仅仅是实现了L2.5功能（AutoPilot）。售卖出去后，用户先使用L2.5的产品，随着数据和测试的积累，可以实现一些相对简单、高频刚需场景的完全无人驾驶，例如高速-匝道-环路场景，及停车场场景等。

通过OTA升级的方式，这辆车半年后从L2.5升级到L3.5的自动驾驶。进一步随着数据和测试的积累，一年后这辆车实现了城市主干道的完全无人驾驶。通过这种方式，可以使得产品Time to Market的时间大大缩短，获得竞争优势。

Q：最初Momenta加入博世加速器的诉求是？

任少卿：选择加入博世加速器是在今年4月份，那时候我们公司成立七八个月。第一，汽车行业是一个很大的行业，所有参与者都意识到合作是必然的事。博世作为其中最大的Tier 1供应商，可能既是我们的供应商，也是我们的一个客户。从这个角度来说，跟博世做深度接触对我们来说是最优先的事情。第二，博世对于汽车行业的了解，对于OEM的了解，对于整个行业格局的判断，是我们迫切需要了解的。第三，我们之前不是做汽车行业的，需要理解汽车行业的思考方式，例如一些系统安全、功能安全需求，博世是这方面的专家。

Q：此次加速器流程，在与博世的碰撞中有哪些收获和进展？

任少卿：第一是专业技术，了解在汽车行业中其他供应商的想法，与大家站在一样的思想起跑线上往后走；第二，对于企业自身定位而言，我们会总结现在的优势以及之后想做的事情，并在与OEM、Tier 1厂商的中、短、长期合作形式上有更多思考。

Q：Momenta目前在国内的测试车方案和测试情况如何？

任少卿：目前我们有L4方案的测试车在限定区域道路上测试，主要搭载传感器是摄像头、GPS、IMU等，同时会搭载激光雷达做安全备份。

Q：我们在做整套L4自动驾驶方案吗？

任少卿：不能说是整套，整套的汽车自动驾驶方案包括传感器系统、功能安全、系统集成等等方面，对我们而言，主要的核心是用这辆车验证我们的算法，让整套概念完整地运行起来，之后如何将方案推向市场，是需要与Tier 1、OEM合作的。

Q：对于视觉和激光雷达等不同方案Momenta是怎样考虑的？

任少卿：我们并不排除其他传感器，从概念上来说，所有传感器都是为系统提供了一个输入，然后基于这个输入采集数据、训练模型，最终产生一个输出。

我们现在主要展示视觉方案有几点考虑。第一，视觉整体的算法难度比较高，门槛相对较高；第二，我们在视觉方面有较深的积累，所以想在这方面优先做一个突破。而至于毫米波雷达、激光雷达等传感器，我们是不排斥的，我们希望激光雷达能尽快做到可量产、价格可接受的程度，对于我们而言是好事。未来，基于多元传感器的融合感知会做得更好，整体技术方案也会推进得更快，现在这个时间，总结一句话，做我们擅长的事情。

Q：目前国内许多初创团队在做视觉加深度学习的感知方案，从技术角度而言，差异化究竟在什么地方？

任少卿：当一个技术出来后，我觉得都不会是独有的，但从技术层面，如何将技术沉淀为一个产品，并成为一个工业界可用的产品，实际需要更大量的努力，包括技术所需要的数据、传感器的搭配等等。

一个技术从学术界到工业界的过渡会经历很大的变化。在学术界数据和算法相对独立，但工业界的玩法是，数据和算法始终紧紧绑定在一起，数据的产生要去考虑算法如何设计，算法的设计也要考虑数据是否能产生。在数据产生的过程中，还需要用算法指导这个数据，到底产生怎样的数据，收集怎样的数据。

所以，你需要用那个你的模型和算法去指导这件事情，将它不断推向优化，一层一层把原来做不好的东西，通过数据、模型和算法的形式解决。

Q：我们属于应用深度学习建立模型，说一个比较老的话题，在深度学习的瓶颈，面对一些极端临界情况下我们的技术方案是如何考虑的？

任少卿：深度学习是一个很高维的东西，所以它本身是会有这样一个问题。如何解决？我认为分几条路。

第一，通过数据和算法层面，使这种临界情况越来越少。第二，事实上，每个传感器都会遇到一些临界问题，这时候通过传感器融合，可以使安全性又提升一个量级。第三，除了传感器融合，实际上后续的路径规划、驾驶决策算法，会与前面的感知联合做综合的优化，提高安全性。

Q：不久前Momenta刚刚发布了招聘信息，这次Momenta扩充团队后，会补充到哪些具体业务中，有怎样的计划？

任少卿：还如刚才所说，主要做感知、地图和决策规划，包括整套技术方案的验证，这些都会做得更深、更好。最终希望尽早推到产品落地的进度上，在这方面会投入更多的人力财力。

Q：这次主要招聘了哪些方面人才？

任少卿：像算法、开发、硬件、软硬件架构的人员都会招，现在也在逐步引进汽车方面的人才（Momenta特意补充了职位申请邮箱：talentoverflow@momenta.ai），我们相当于与整个汽车行业合作，需要知道他们的一些专业技术，我们公司内部双方面的人才都要有。

Q：团队下一阶段的主要规划是？

任少卿：下一阶段，主要是寻找产品落地，比如L2.5方案和L3.5方案的产品落地，我们做不同级别的自动驾驶解决方案，包括L4。

Q：能具体说说L2.5和L3.5是怎样定义的吗？

任少卿：我们定义的L2.5类似特斯拉Autopilot，但可能会更先进一些的方案，简单来说还是人占主导地位。L3.5更多地在限定路段中将人解放出来，可以参考市面上唯一号称L3解决方案的奥迪A8，我们可能将一些限制条件再放宽些。【完】