研究人员使用AI预测心脏相关疾病死亡率
2018年12月14日 由 浅浅 发表
931599
0
在美国,急性心肌梗死(AMI)或冠心病是死亡的首要原因之一,而到2035年,据估计,有将近一半的成年人可能会遭受此类病痛。令人不安的是,AMI的大多数发生前都没有明显的症状,如胸痛或呼吸急促。现在,佛罗里达州立大学和佛罗里达大学盖恩斯维尔分校的研究人员正在利用AI,预测经历过一次发作的重症监护病房患者的一年的死亡率。
研究人员写道,选择一年死亡率作为预测窗口,是因为它可以与其他研究进行比较,并且因为它将考虑在两年内多次接受AMI相关ICU入院患者。
在发布的论文“Building Computational Models to Predict One-Year Mortality in ICU Patients with Acute Myocardial Infarction and Post Myocardial Infarction Syndrome”中,研究人员表示,与需要手动计算分数的风险评估指南相比,利用基于机器学习的疾病预后(如死亡率)预测来节省时间并提高预测准确性,这项研究建立并评估了各种机器学习模型,以预测诊断为急性心肌梗死或心肌梗塞后综合征的患者的一年死亡率。
团队使用了MIMIC-III数据集,这是一个免费提供的重症监护数据库,由麻省理工学院计算生理学实验室维护,包含来自40000名患者的58000名入院患者。通过选择“死亡率预测因子”特征,例如肾脏和肝功能,入院,人口统计学,治疗,评估长期和短期总体健康状况的实验室价值,他们将该名单削减至5037名受试者。
研究小组决定根据5436名确诊为急性心肌梗塞或经前综合症的患者数据进行分析。因为在某些情况下,病人在一次入院后存活,但在另一次死亡。
研究人员对这些记录进行了预处理,以消除重复记录,对相同的输入、数据输入错误和异常值进行多次处理。为了比较几种不同机器学习模型的性能,他们选择了WEKA,这是新西兰Waikato大学开发的一种基于java的软件。
团队在拥有2.2GHz Intel Core i7处理器的PC上使用TensorFlow框架,训练了十几种分类算法,包括AdaBoost,属性选择分类器,贝叶斯网络。
在测试中,两个AI模型表现优于其他模型:逻辑模型树(LMT)和简单逻辑算法,在识别入院一年内死亡的数据集(1629)中30%的患者达到85.12%的准确率(第三名准确率为84.88%)。有趣的是,一种深度神经网络模型在识别一年内死亡的病人的能力上优于所有机器学习算法。
研究人员写道:“这反映了数据科学中的共识,即没有普遍适用的算法能够始终优于所有其他算法。有许多因素会影响心肌梗死后的死亡率。找出利用这些因素信息的方法将有助于准确预测可能的结果。”
该论文的作者指出,不平衡的数据集(占一年死亡病例的30%)是该研究的一个限制因素,实验室和图表值缺失等数据缺口也是一个限制因素。但他们认为,正确诊断和治疗急性心肌梗塞对一年死亡率有明显的影响。
团队表示,“从这个数据集中可以看出,没有一个特定因素可以提供所需的可预测性信息,而能够包含所有相关标准可以改善预测,通过使用机器学习获得的改善的可预测性可以帮助有风险的患者努力遵守治疗计划,以降低死亡风险。”
论文:
arxiv.org/ftp/arxiv/papers/1812/1812.05072.pdf