机器学习方法现可以更快地预测某些沙门氏菌的动物来源
2019年02月15日 由 浅浅 发表
549804
0
由格里芬佐治亚大学食品安全中心的研究人员开发了一种机器学习算法,可以更快地识别某些沙门氏菌的动物来源。
这项研究发表在2019年1月出版的“Emerging Infectious Diseases”期刊上。在这项研究中,团队使用了1000多个基因组来预测伤寒沙门氏菌的动物来源,重点是牲畜。
根据食源性疾病暴发监测系统,2009年至2015年,美国报告了近3000起食源性疾病暴发。
Deng表示,其中的900例,即30%,是由包括Typhimuirum在内的不同血清型沙门氏菌引起的。
团队表示,“我们在2018年至少爆发过三次Typhimuirum或其近似变种疾病。这些暴发与鸡肉,鸡肉沙拉和干椰子有关,有超过2600种血清型的沙门氏菌,而鼠伤寒只是其中之一,但自20世纪60年代以来,美国国家监测报告的与疫情有关的沙门氏菌分离株中,约有四分之一是Typhimuirum。”
研究人员训练了一种称为随机森林的算法,具有1300多种具有已知来源的Typhimuirum沙门氏菌基因组。训练结束后,机器学会了预测鼠伤寒沙门氏菌基因组的某些动物来源。
在这项研究中,科学家们使用了来自三个主要监测和监测计划的鼠伤寒沙门氏菌基因组:CDC的PulseNet网络;FDA在美国,欧洲,南美洲,亚洲和非洲的GenomeTrakr数据库;国家抗菌药物耐药监测系统的FDA部门的零售肉类分离物。
Deng表示,“有了这么多基因组,机器学习是处理所有这些数据的自然选择。我们使用这一大量的鼠伤寒基因组作为训练集来构建分类器,分类器通过询问基因组的数千个遗传特征来预测Typhimuirum病毒的来源。”
总体而言,该系统预测了Typhimuirum沙门氏菌的动物来源,准确率为83%。该分类器在预测家禽和猪来源方面表现最佳,其次是牛和野鸟。机器还能检测其预测是否精确。当预测准确时,机器准确率约为92%。
“我们回顾性分析了1998年至2013年美国发生的8起主要人畜共患病爆发事件,分类器将其中七个归因于正确的牲畜来源。”
这个工具有局限性,它不能预测海产品作为来源,也很难预测在不同动物之间转换的沙门氏菌菌株。这种方法是一种概念验证。随着来自不同来源的更多基因组变得可用,它会变得更好。
FDA的副主任Frank Yiannas称全机基因组序列的机器学习是智能食品安全和流行病学的新时代。
这个项目的成功意味着可以更快追溯Typhimuirum沙门氏菌的菌株到源头。确定导致食源性疾病爆发的原因是阻止疾病和预防进一步疾病的关键。
使用该方法,研究人员可以更好地将同一爆发的病例联系起来,更好地将食品或食品加工环境中的菌株与病人隔离开来,这将使研究人员更有信心揭示疾病爆发背后的特定来源。