植物机器学习模型识别有灭绝风险的植物物种
2019年01月08日 由 浅浅 发表
350293
0
科学家已记录了近40万种植物物种,并期望识别出更多物种。但与众所周知的濒临灭绝的动物不同,我们目前尚不了解全世界90%以上植物物种的状况。植物生长和社区驱动着每个大陆的生态系统,食物链和农业,但导致它们茁壮成长或消失的条件还是未知的。
了解特定植物物种受到的威胁程度,需要其生活的位置和外观的广泛信息。但是,在野外寻找植物以确定它们的位置需要大量时间,金钱和专业知识。
一个多机构组成的研究团队利用开放存取数据库和机器学习的力量来预测超过15万株植物的保护状况。他们的研究在上个月公布在美国国家科学院论文集上,团队测试了机器学习算法是否能够跟踪位置,气候模式,栖息地特征的图案和形态,它们的形式和结构,并利用这些信息来确定可能面临灭绝风险的物种。
作者在论文中说:“我们迫切需要更有效的方法来识别有风险的物种。为了满足这一需求,我们开发并评估了一种预测方案,该方案允许对未经研究的植物分类群的保护状态进行快速初步评估。”
物种赖以生存的基本栖息地
随着人类将草原,森林,甚至沙漠转变为耕地,种植园,原生植物种群数量减少,物种消失。科学家估计,超过20%的(陆地)植物物种可能面临灭绝的威胁。但这个数字只是猜测。
国际自然保护联盟的濒危物种红色名录,列出了受威胁物种的名录,并将其作为优先保护物种的工具。到目前为止,科学家们对39万多种已知植物物种的评估还不到10%。但已评估了所有公认的鸟类和哺乳动物物种。
“植物构成了所有物种依赖的基本栖息地,因此从植物开始是有道理的,”共同作者,俄亥俄州立大学进化学,生态学和生物学教授Bryan Carstens表示,“很多时候在自然保护中,人们关注的是大型的、有魅力的动物,但实际上栖息地才是最重要的。我们可以保护所有我们想要的狮子、老虎和大象,但他们必须有一个地方住。”
红色名录评估物种灭绝的可能性,并使用特定标准将其分类为最不受关注的,脆弱的,濒危的,极度濒危的,野生灭绝的和已灭绝的。缺乏数据的物种有潜在的危险,但研究得太少,无法进行分类。
科学家在制定保护重点和进行工业使用的环境影响评估时,考虑了这些IUCN的红色清单类别。然而,评估每一个额外物种的保护状况需要时间和金钱,以及专业知识,这导致许多具有高灭绝风险的物种没有被列入名单。
尽管植物对农业和生态系统的十分重要,但与魅力十足的大型猫科动物和色彩斑斓的鸟类相比,它们通常得不到那么多的关注和支持。
“在这些分析中没有植物意味着人们正在使用不完整的数据集,”负责协调Red List在北美工作的植物学家Anne Frances指出,“我们正在确定关键的生物多样性区域,而没有考虑到大部分的生物多样性。”
科学家们预计,由于直接灭绝或气候变化导致的植物物种的消失,将导致依赖它们的动物自下而上相继消失。
根据“世界植物状况”报告,科学家每年成功描述大约2000种新的植物物种,这加剧了评估其保护状况的问题。
植物与随机森林法
研究人员希望找到一种方法来使用新的数据处理技术来加速评估过程,并使其更具成本效益。
他们编写了数十年来科学家从全球生物多样性信息机构和TRY植物特性数据库收集的开源数据,其中包括来自世界各地的15万株植物的位置,气候,环境和外观。这些代表GBIF中近95%的植物物种,我们有数据但从未被IUCN红色名录评估过。
这个庞大的数据库包括对植物的观察,其中GBIF提供了位置坐标,但尚未通过IUCN红色名录进行评估。
研究人员建立了一个机器学习模型,确定与物种灭绝风险的不同级别(类别)相关的特征,并使用IUCN红色名录中已经分类的相对较少的植物物种(因此它们的保护状况是已知的)来训练它。然后,他们运用该模型预测了15万种未知物种的灭绝风险。
研究人员使用随机森林法建立了他们的模型,在植物的情况下,模型测试给定属性是否与濒临灭绝的植物有关,例如植物的纬度或经度;海拔;土壤类型;雨量;温度;道路,城镇或保护区的距离。根据结果,研究人员可以决定哪种特征能最好地预测植物风险。
通过比较具有已知濒临灭绝风险的IUCN红色列表植物的特征与未知风险植物的特征,该模型计算出给定的未分类植物物种实际面临灭绝风险的可能性,因此需要更深入的评估。它还确定了在预测保护风险方面最重要的变量。
成千上万的物种面临风险
该模型表明,超过15000个未编入册的物种有濒临灭绝的风险,大约占分析中的10%,因此也存在保护问题。
在全球范围内,空间特征,如物种范围内纬度的大小和范围,比气候或形态学(例如高度或木质度)更能准确预测灭绝风险。具有较小范围的物种通常具有较小的种群,比较大的种群更可能灭绝。然而,没有一个单一的全球变量预测保护状态。
研究人员利用这些结果确定了具有大量高风险植物物种的区域,并提出了有助于保护这些区域的工具。对于分析中的每一个观察,它们将植物的濒临灭绝风险的概率与其GPS坐标相关联。他们计算了覆盖全球的1°×1°网格的每个小格内所有GPS坐标的平均风险概率,并给出了每个小格的风险值。
绘制植物数据图揭示了模型预测中的几个主要地理趋势。濒危植物往往集中在已知的植物多样性高的地区,包括加利福尼亚、中美洲、马达加斯加、美国东南部和澳大利亚西南部。其中一些地方还栖息着许多地方特有的物种,这些物种在其他地方不存在。
它还确定了一些鲜为人知的生物多样性区域,如塔斯马尼亚岛和阿拉伯半岛南部的沿海雾沙。根据共同作者,马里兰大学助理教授AnahíEspíndola的说法,一些最危险的地区受到的关注非常有限,但新方法可以帮助确定需要进一步研究的地区和物种。
Espíndola在一份声明中表示,机器学习预测不能取代现场观测的正式评估,但可以帮助识别有风险的物种和区域,以进行更深入的研究。“当我第一次开始考虑这个项目时,我怀疑许多具有高度多样性的地区将得到很好的研究和保护,但我们发现情况恰恰相反。”
研究人员希望该模型能够为有限的栖息地保护资源提供帮助。通过将GPS坐标与地图的风险概率配对,可以帮助研究人员找到需要保护的地区。
Espíndola说,“该模型可以适应任何地理范围,我们所使用的都是可开放获取的,突出了公开数据的强大功能。我们希望人们能够使用我们的模型,指出并修复错误,让系统更完善。”