机器学习工具走进医疗:实时检测新型细菌危险性,控制预防疾病爆发
2018年05月10日 由 浅浅 发表
762613
0
一种新型机器学习工具可用于检测新出现的细菌菌株沙门氏菌:比起食物中毒,它是否更有可能导致危险的血液感染。该工具由Wellcome Sanger研究所的科学家、新西兰奥塔哥大学的合作者、基于RNA的感染研究的德国Helmholtz感染研究中心开发,加快了确定新型侵入性沙门氏菌基因变化过程,这也是公众健康方面值得关注的问题。
PLOS遗传学报告中指出,机器学习工具可以在危险细菌爆发之前进行标记,范围可从医院病房扩展到全球。
然而,以当前的方法,确定爆发后新出现细菌菌株遗传适应性非常耗时,并且通常需要手动将新菌种与过去的菌种进行比较。
沙门氏菌群包括许多不同的类型,引起疾病的严重程度不同。有些类型会导致食物中毒,称为胃肠道沙门氏菌,而另一些会扩散到肠道外导致严重疾病,例如导致伤寒的伤寒沙门氏菌(Salmonella Typhi)。
为了确定新出现的肠道沙门氏菌菌株究竟会导致食物中毒还是更严重的感染,研究人员建立了一个机器学习模型,分析哪些突变会在其中起重要作用。
小组使用古老的沙门氏菌谱系训练了这一模型,这些谱系在进化上表现不同,其中包括六种引起侵入性感染的沙门氏菌,以及七种胃肠道细菌菌株。机器学习模型辨认了将近200个基因,用于确定细菌是否会引起食物中毒或更好地适应侵入性感染。
来自Wellcome Sanger研究所,这篇论文主要作者Nicole Wheeler博士表示,“我们设计了一种新的机器学习模型,可以识别哪些新出现的细菌菌株可能成为公众健康的威胁。使用这个工具,我们可以处理大量的数据集并在几秒钟内获得结果,最终这项工作将对我们之前无法检测的危险细菌产生重大影响。”
当使用撒哈拉以南非洲地区目前出现的沙门氏菌菌株做检测时,该工具正确地辨别了两种类型的流行性感染(肠炎沙门氏菌和鼠伤寒沙门氏菌),它们更加危险且与更多的血液感染病例相关。
这些感染在免疫系统功能弱的人群中尤为严重,如HIV感染者。机器学习工具揭示了使沙门氏菌菌株适应宿主并变得更具侵入性的遗传变化。
Lars Barquist博士认为,“与其他方法相比,机器学习工具相当实用,因为它不仅可以搜索基因和突变,并寻找这些问题中的功能性影响突变,它还可以告诉我们哪些突变会使病原体更好地扩散到肠道外,且导致威胁生命的疾病而非食物中毒,这些功能将有助于设计更有效的治疗方法。”
利物浦热带医学院的Nicholas Feasey博士表示,“我们已经在使用这种方法来寻找亚洲与非洲流行的沙门氏菌伤寒菌株的主要区别,而无需手动比较不同菌株的基因组,而且用不上几周或几个月,在几秒钟内就可以发现新出现的细菌菌株背后的遗传变化,它提供了实时研究疾病的潜力,可迅速提出公共卫生策略来控制或预防疾病。”
机器学习工具可以产生基于随机森林模型的侵入力指数,不仅限于沙门氏菌,还可用于研究其他因素,如各种细菌中出现的抗生素耐药性。它还可以在细菌菌株爆发扩散之前进行实时识别。