研究人员首次在外太空成功训练机器学习模型
2023年07月31日 由 Alex 发表
561045
0
研究人员首次在外太空在卫星上训练了一个机器学习模型。这一成就可以实现从灾害管理到森林砍伐等一系列应用的实时监测和决策。
该项目已在出版物《卫星上的快速模型推理和训练》中进行了总结。该出版物可在预印本服务器arXiv上获取。这项工作也在2023年7月21日的国际地球科学与遥感研讨会(IGARSS)会议上进行了介绍。
遥感卫星收集的数据是许多关键活动的基础,包括航空测绘、天气预报和监测森林砍伐。目前,大多数卫星只能被动地收集数据,因为它们不具备做出决定或检测变化的能力。相反,数据必须传输到地球进行处理,这通常需要几个小时甚至几天的时间。这限制了识别和应对迅速出现的事件(如自然灾害)的能力。
为了克服这些限制,由博士研究生Vít Růžička(牛津大学计算机科学系)领导的一组研究人员接受了在外太空训练第一个机器学习程序的挑战。
在2022年期间,该团队成功地向“穿越星空”任务提出了他们的想法,该任务已公开征集项目提案,将在2022年1月发射的ION SCV004卫星上执行。在2022年秋天,该团队将该计划的代码上传到已经在轨的卫星上。
研究人员训练了一个简单的模型,可以直接在卫星上从航空图像中检测云层覆盖的变化,这与地面上的训练形成鲜明对比。该模型基于一种称为“少采样学习”的方法,该方法使模型能够在只有少量样本的情况下学习最重要的特征。一个关键的优点是,数据可以被压缩成更小的表示形式,使模型更快、更高效。
Vít Růžička表示:“我们开发的模型称为RaVAEn,首先将大型图像文件压缩为128个数字的向量。在训练阶段,模型学习只保留该向量中的信息值;那些与它试图检测的变化有关的——在这种情况下,是否有云存在。由于只需要训练一个非常小的分类模型,因此训练速度非常快。”
模型的第一部分用于压缩新看到的图像,在地面上进行训练,而第二部分(决定图像是否包含云)则直接在卫星上进行训练。
通常,开发机器学习模型需要使用一组连接的计算机的能力进行多轮训练。相比之下,该团队的微型模型在大约1.5秒内完成了训练阶段(使用了1300多张图像)。
当团队在新数据上测试模型的性能时,它会在十分之一秒内自动检测出云是否存在。这涉及到相当于约4.8 x 4.8 km
2区域的场景进行编码和分析(相当于近450个足球场)。
根据研究人员的说法,该模型可以很容易地进行调整,以执行不同的任务,并使用其他形式的数据。Vít Růžička补充说:“完成这个演示后,我们现在打算开发更先进的模型,可以自动区分感兴趣的变化(例如洪水、火灾和森林砍伐)和自然变化(例如季节中叶子颜色的自然变化)。”
“另一个目标是为更复杂的数据开发模型,包括来自高光谱卫星的图像。例如,这可以检测甲烷泄漏,并对应对气候变化产生关键影响。”
在外太空进行机器学习还可以帮助克服星载卫星传感器受到恶劣环境条件影响的问题,因此它们需要定期校准。
Vít Růžička说:“我们提出的系统可以用于非均匀卫星星座,其中一颗卫星的可靠信息可以应用于训练星座的其余部分。例如,这可以用来重新校准随着时间的推移而退化或经历环境快速变化的传感器。”
来源:https://techxplore.com/news/2023-07-successfully-machine-outer-space.html