机器学习模型可以显示最可能出现高污染水平的地点和时间,但它们通常无法处理更多的随机事件。
加拿大极端火灾季节产生的野火烟雾让很多人开始关注空气质量问题,并且想知道未来几天会发生什么。
所有空气中都含有气体化合物和小颗粒。这些气体和微粒进入鼻腔、喉咙和肺部,甚至在血液中循环,随着空气质量的恶化,更有可能引发哮喘,加剧心脏和呼吸系统问题。2023年6月初,当野火烟雾将纽约市的天空染成橙色时,因哮喘到急诊室就诊的人数增加了一倍。
在大多数城市,很容易就能找到每日空气质量指数得分,告诉您空气何时被视为不健康甚至有害。然而,预测未来几天的空气质量并不那么简单。
人工智能可以提高空气质量的预测水平,但研究表明,将人工智能与传统技术相结合,可以得到更好的结果。原因如下:
要预测未来一段时间的空气质量,科学家通常依赖两种主要方法:化学传输模型或机器学习模型。这两种模型产生结果的方式完全不同。
化学传输模型使用大量已知的化学和物理公式来计算空气污染物的存在和产生。它们使用的数据来自当地机构报告的排放清单,其中列出了来自已知来源(如野火、交通或工厂)的污染物,以及提供大气信息(如风、降水、温度和太阳辐射)的气象学数据。
这些模型模拟空气污染物的流动和化学反应。然而,它们的模拟涉及多个变量,不确定性很大。例如,云量会改变进入的太阳辐射,从而改变光化学。这会降低结果的准确性。
相反,机器学习模型可以从历史数据中学习一段时间内的模式,从而预测任何给定区域的未来空气质量,然后将这些知识应用于当前条件,预测未来几天的空气质量。
机器学习模型的缺点是不像化学传输模型那样考虑到化学和物理机制。此外,在热浪或野火事件等极端条件下,如果模型没有经过此类数据的训练,机器学习预测的准确性也会出现偏差。因此,尽管机器学习模型可以显示何时何地最有可能出现高污染水平,例如在高速公路附近的高峰时段,但它们通常无法处理更多随机事件,例如从加拿大吹来的野火烟雾。
科学家们已经确定,这两种模型本身都不够准确,但是将两种模型的最佳属性结合起来使用,可以帮助更好地预测我们呼吸的空气质量。
这种组合方法被称为ML-MMF,能够提供基于科学的预测,准确率超过90%。它以已知的物理和化学机制为基础,可以模拟从空气污染源到你的鼻子的整个过程。添加卫星数据可以帮助科学家更准确地告知公众空气质量安全水平和污染物的移动方向。
最近,我们将这三种模型的预测结果与实际污染测量结果进行了比较。结果令人震惊:综合模型的准确度比化学传输模型高出66%,比单独的机器学习模型高出12%。
化学传输模型仍是目前最常用的空气质量预测方法,但机器学习模型的应用量正在逐渐增加。美国环保署 AirNow.gov 网站使用的常规预测方法就依赖于机器学习。该网站还汇编了各州和地方机构的空气质量预测结果,其中大部分都使用了化学传输模型。
随着信息来源变得更加可靠,综合模型将成为预测有害空气质量的更准确方法,尤其是在野火烟雾等不可预测事件期间。