MIT开发新算法,衡量探索未知区域的风险和回报
2019年02月02日 由 浅浅 发表
659457
0
目前,我们对地球海洋的了解实际上远远少于对月球或火星表面的了解。海底有着广阔的峡谷、高耸的海底山、深深的海沟和陡峭的悬崖,其中大多数都十分危险或难以到达的,以至于无人水下航行器(AUV)无法航行。但是,如果探索这些地方的回报值得去冒险呢?
MIT开发了一种算法,可以让AUV权衡探索未知区域的风险和潜在回报。例如,如果负责识别水下石油渗漏的车辆靠近陡峭的岩石海沟,该算法可以评估奖励水平(在该海沟附近存在油渗漏的概率),以及风险等级(与障碍物相撞的概率)。
MIT航空航天系研究生Benjamin Ayton说:“如果在所获得的回报和走向这些危险地区的风险或威胁之间权衡,我们可以在值得的时候承担某些风险。”
新算法可以实时权衡风险与奖励,因为机器决定下一步探索的位置。团队正在实施这种算法以及其他有关AUV的算法,其愿景是为大量任务部署智能机器人探险队,包括寻找海上石油储藏,调查气候变化对珊瑚礁的影响,并探索类似于木卫二的极端环境。
Ayton表示,“假设我们去木卫二,并且有充分的证据证明,在一个洞穴或裂缝中可能会有价值10亿美元的观测结果,所以向木卫二发射一艘宇宙飞船是合理的,我们绝对希望冒险进入那个洞穴。但是,不考虑风险的算法永远也找不到可能改变历史的观测结果。”
团队将于本周在AAAI人工智能促进协会上展示他们的新算法。
一条大胆的道路
该团队的新算法是第一个实现“风险界限自适应采样”的算法。例如,自适应采样任务被设计为基于工具在探索给定区域时所采用的新测量值自动调整AUV的路径。考虑风险的大多数自适应采样任务通常通过找到具有可接受风险水平的具体路径来实现。例如,AUV可以仅接受碰撞概率不超过5%的路径。
但研究人员发现,仅考虑风险可能会严重限制任务的潜在回报。 Ayton表示,“在我们执行任务之前,我们希望明确我们愿意为某种程度的回报承担的风险。”
该团队的算法接收测深数据,或有关海洋地形的信息,包括周围的障碍物,以及探测工具的动力学和惯性测量,来计算特定路径的风险等级。该算法还考虑了AUV之前的所有测量值,以计算这种高回报测量值可能存在于建议路径上的概率。
如果风险-回报率达到了科学家事先确定的某个值,AUV就会继续按照建议的路径前进,在前进过程中对算法进行更多的反馈测量,以帮助它评估其他路径的风险和回报。
研究人员在波士顿港以东的AUV任务模拟中测试了他们的算法。他们使用了在之前的NOAA调查期间从该地区收集的测深数据,并在相对较高的温度下模拟了水下航行器在15米深的区域进行探测。他们研究了在三种不同的可接受风险情况下,算法是如何规划探测工具的路线的。
在最低可接受风险的情况下,意味着探测工具应该避开任何高碰撞机率的区域,该算法绘制出保守路径,将车辆保持在也没有任何高回报的安全区域中。对于具有较高可接受风险的情景,该算法绘制了较大的路径,使探测工具通过狭窄的深坑,最终到达高回报区域。
该团队还对该算法进行了1万次数值模拟,在每次模拟中生成随机环境来规划路径,结果发现该算法能够直观地权衡风险和回报,只有在得到回报的情况下才会采取危险的行动。
风险倾斜
去年12月,Ayton,Williams和其他人花了两周的时间在哥斯达黎加海岸巡航,部署水下滑翔机,测试了几种算法,包括最新的算法。在大多数情况下,算法的路径规划与几个寻找找到石油渗漏的最佳路线的船上地质学家提出的路径规划一致。
Ayton说,这个算法找到了一种让我们迅速摆脱困境的方法,同时也是最有价值的方法。它带我们走上了一条道路,虽然它没有帮助我们发现石油渗漏,但它确实帮助我们完善我们对环境的理解。
真正有趣的是观察几次潜水结果后机器算法开始学习,并开始选择地质学家最初可能没有选择的地点,这一过程的这一部分仍在不断发展,但令人兴奋的是,算法开始从大量数据中识别新模式,并将这些信息与高效、安全的搜索策略相结合。”
在他们的长期愿景中,研究人员希望使用这些算法来帮助自动驾驶车辆探索地球以外的环境。