MIT机器学习模型对ICU患者死亡风险的预测更为准确

2018年08月31日 由 浅浅 发表 447975 0
MIT机器学习模型对ICU患者死亡风险的预测更为准确

麻省理工学院的研究人员开发了一种机器学习模型,可以根据健康状况将患者分为亚群,以更好地预测患者在ICU住院期间死亡的风险。该技术优于“全球”死亡率预测模型,并揭示了这些模型在特定患者亚群中的性能差异。

在重症监护室,患者出现各种健康状况,急救分类在很大程度上依赖于临床判断。ICU工作人员进行许多生理测试,例如血液检查和检查生命体征,以确定如果没有积极治疗,患者是否即刻面临死亡风险。

近年来已经开发了许多机器学习模型来帮助预测ICU中的患者死亡率,基于他们逗留期间的各种健康因素。然而,这些模型具有性能缺陷。一种常见类型的“全球”模型是针对单个大型患者群体进行训练的。这些可能在平均水平上有效,但在一些患者亚群中效果不佳。另一方面,另一种类型的模型分析不同的亚群,例如,按类似条件,患者年龄或医院部门分组的那些,但通常用于训练和测试的数据有限。

在最近“Proceedings of Knowledge Discovery and Data Mining”会议上发表的一篇论文中,麻省理工学院的研究人员描述了一种机器学习模型,该模型在两个方面都是最好的:它专门针对患者亚群进行训练,但也在所有亚群中共享数据以获得更好的效果预测。通过这样做,与严格的全球模型和其他模型相比,该模型可以更好地预测患者在ICU最开始两天的死亡风险。

该模型首先在以前入住的ICU患者的电子健康记录中处理生理数据,其中一些患者在住院期间死亡。通过这样做,它学习了死亡率的高预测因子,如低心率、高血压,以及各种实验室测试结果,在最初的几天里,高葡萄糖水平和白细胞计数,并根据他们的健康状况将病人分成亚群。给定一名新患者,该模型可以从头24小时查看该患者的生理数据,并通过分析这些患者亚群,了解新患者在接下来的48小时内死亡的可能性。

此外,研究人员发现,通过特定亚群评估(测试和验证),模型还突出了全球模型在预测患者亚群死亡率方面的性能差异。这是开发模型的重要信息,可以更精确地研究特定的病人。

“ICU患者很多,”论文第一作者,计算机科学与人工智能实验室(CSAIL)研究生Harini Suresh说,“重要的是要提前弄清楚患者是否处于危险之中并且更需要立即引起注意。”

该论文的共同作者是CSAIL研究生Jen Gong和John Guttag,电气工程教授Dugald C. Jackson。

多任务处理和患者亚群


该项工作的一项重要创新是,在训练期间,该模型将患者分为不同的亚群,这些亚群捕获患者整体健康状况和死亡风险的各个方面。它通过计算按小时分解的生理数据的组合来实现。生理数据包括例如葡萄糖,钾和氮的水平,以及心率,血液pH,氧饱和度和呼吸率。血压和钾水平升高(心力衰竭的迹象),可能表明健康问题超过其他亚群。

接下来,该模型采用多任务学习方法来构建预测模型。当患者被分成亚群时,为每个亚群分配不同的调整模型。然后,每个变体模型可以更准确地对其个性化患者组进行预测。这种方法还允许模型在进行预测时在所有子群体之间共享数据。当给予新患者时,它将患者的生理数据与所有亚群匹配,找到最佳拟合,然后从那里更好地估计死亡风险。

Suresh说,“我们正在使用所有患者数据并在相关的人群中共享信息,通过这种方式,我们不会遇到数据稀缺问题,同时考虑到不同患者亚群之间的差异。”

患者入住ICU的原因和健康状况是不同的。因为这样,他们的待遇会非常不同。临床决策辅助工具应该考虑到这些患者群体的异质性并确保有足够的数据进行准确的预测。

Gong说,这种方法的一个关键见解来自于使用多任务处理方法来评估模型在特定子群体上的表现。通常在整个患者群体中评估全局模型的整体表现。但研究人员的实验表明,这些模型实际上在亚人群中表现不佳。本文测试的全球模型总体上相当准确地预测了死亡率,但在对个体亚群进行测试时,准确度下降了几个百分点。

如果不通过亚人群进行评估,这种表现差异难以衡量,Gong表示,“我们想要评估我们的模型的效果,不仅仅是对整个患者队列进行评估,而且当我们为每个具有不同医学特征的队列分解时,我们也要评估。这可以帮助研究人员更好地进行预测模型培训和评估。”

获得结果


研究人员使用来自MIMIC重症监护数据库的数据测试了他们的模型,该数据库包含有关异质患者人群的大量数据。在该数据约32000名患者中,超过2200名患者死于该医院。他们使用80%的数据集进行训练,20%用于测试模型。

在使用前24小时的数据时,该模型将患者聚集到具有重要临床差异的亚群中。例如,两个亚群包含在最初几个小时内血压升高的患者,但一个随着时间的推移而降低,而另一个则在一整天内保持升高。该亚群的死亡率最高。

使用这些亚群,该模型在接下来的48小时内以高特异性和灵敏度以及各种其他指标预测患者的死亡率。多任务处理模型的表现明显优于全球模型几个百分点。

接下来,研究人员的目标是使用来自电子健康记录的更多数据,例如患者接受的治疗。他们还希望将来训练模型,从数字化临床笔记和其他信息中提取关键词。

这项工作得到了美国国立卫生研究院的支持。
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消