谷歌:利用深度学习模型提取信号做临床预测,或将提高医护质量

2018年05月09日 由 浅浅 发表 647612 0
谷歌:利用深度学习模型提取信号做临床预测,或将提高医护质量
当病人被送进医院时,可能想问很多问题,比如:我什么时候能回家?我会好转吗?我康复之后还可能复发吗?如果能细致地回答这些问题,就可以让医护更好、更安全、更快速,医生还可以在病人病情恶化之前主动采取一些手段。

预测接下来会发生什么是机器学习的应用领域。那么在你通勤时预测交通状况,或者在英语翻译到西班牙语时预测下一个词,这些类型的机器学习是否也可以用于临床预测呢?在实践中,实用的预测至少应该是这样的:

  • 可扩展性:对于任何重要的结果和不同的医院系统,预测都应该直截了当。由于医疗数据非常复杂并需要大量的数据整理,所以这一要求并不容易满足。

  • 准确性:预测应该提醒临床医生注意问题,而不能用假警报来分散他们的注意力。随着电子健康记录的广泛使用,我们能够使用这些数据来创建更准确的预测模型。


谷歌与加州大学旧金山分校(UC San Francisco),斯坦福大学医学院(Stanford Medicine)和芝加哥大学医学院(The University of Chicago Medicine)的同事们一起,在自然合作期刊的数字医学上联合发表了“Scalable and Accurate Deep Learning with Electronic Health Records”论文,总结了上面两个要点。

研究者用深度学习模型,对使用反识别电子健康记录的住院患者进行广泛的预测。重要的是,我们能够直接使用这些数据,而无需花费精力进行人工提取、清理、协调和转换这些记录中的相关变量。

谷歌的合作伙伴在发送信息之前就已经删除了敏感的个人信息,而谷歌这边使用最先进的安全系统保护数据,包括逻辑分离、严格的访问控制,以及在静止和传输过程中对数据加密。

可扩展性


电子健康记录(EHRs)其实相当复杂。即使是温度也因测量位置(如舌下、耳膜、前额)不同而具有不同的含义。而且这只是最简单的生命征象。

此外,每个医疗体系都定制了独有的EHR系统,导致相似的病人在一家医院的数据与另一家医院的数据不同。在我们应用机器学习之前,要使病人记录具有一致性,可以通过之前提到的开放的标准Fast Healthcare Interoperability Resources (FHIR)来建立。

一旦解决了一致性的问题,就不需要手动选择或协调要使用的变量。相反,对于每一个预测,深度学习模型读取从最早到最新所有的数据点,然后学习哪些数据有助于预测结果。这可能涉及到数千个数据点,所以必须开发基于递归神经网络(RNNs)和前馈网络(feedforward networks)的深度学习建模新方法。

用时间轴表示病例信息中的数据

用时间轴表示病例信息中的数据。为了便于说明,我们可以按行排列各种类型的临床数据(如交汇、实验室测试)。每一份数据都用小灰点标注,存储在FHIR中,它是可被任何医疗机构使用的开放性数据标准。深度学习模型通过从左到右读取时间线来分析病例信息,其中包括从住院到目前的治疗情况,然后利用这些数据做出不同类型的预测。

因此,我们设计了一个计算机系统来进行预测,而不需要以可扩展的方式为每个任务手动创建新的数据集。不过建立数据只是工作的一部分,这些预测也需要准确性。

预测的准确性


确定准确性的最常见方法是“受试者工作曲线下的区域”(area-under-the-receiver-operator curve),它衡量的是模型区分有特定未来结果的病人与没有特定结果的病人时表现如何。在这个标准下,1.00很完美,0.50几乎等同于随机因素,所以数字越高模型越准确。

通过这一方法,使用论文中报告的模型进行预测,预测病人是否会在医院很长时间的得分为0.86(传统的逻辑回归得分为0.76);预测住院病人死亡率得分为0.95(传统方法是0.86);预测病人出院后再次住院得分为0.77(传统方法是0.70)。这些结果在统计上是显著的。

我们还使用这些模型来确定病人接受治疗的条件。例如,如果一个医生为体温高、发烧并咳嗽的病人开了头孢曲松和强力霉素,这个模型就可以通过这些信号判断病人正在接受肺炎治疗。因此,这个模型并不是诊断病人,而是通过病人的治疗过程和临床医生所写记录来提取信号,所以这个模型更像是一个倾听者而非大师级的诊断专家。

这一研究的重点在于深度学习模型的解释能力。每个预测的图表显示了模型在做出预测时考虑的重要数据点。下面有一个概念验证的例子,这也是临床医生可用预测的重点部分。

临床医生可用预测的重点部分

在病人住进医院24小时后,用深度学习模型做出预测。时间轴(顶部)包含几个月的历史数据,最新的数据显示在中间。这个模型用病例信息中以红色突出显示的信息解释预测。在这个案例中,模型突出显示了在临床上有意义的信息。

这项研究对于病人和临床医生意味着什么?


这项研究的结果还只是在最初阶段,并且只基于旧的数据。这篇文章仅代表对“机器学习可以改善医疗保健吗”这一假说的检验。

医生们的注意力被各种警报和要求占据,而问题在于:这些模型是否可以帮助医生完成繁琐的行政任务,让医生能更好地关注眼前的病人或需要额外注意的病人。无论在哪里,能帮助病人获得高质量的护理吗?期待未来与医生和病人合作研究,找出这些问题的答案。

 
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消