卷积神经网络检测皮肤癌已超越皮肤科专家
2018年05月29日 由 浅浅 发表
333195
0
研究人员首次发现深度学习卷积神经网络(CNN)比经验丰富的皮肤科医生在检测皮肤癌方面表现更好。
在发表在主要癌症杂志Annals of Oncology [1]上的一项研究中,德国,美国和法国的研究人员通过向CNN展示100,000多张恶性黑色素瘤(皮肤癌最致命的形式)以及良性痣图像。他们将其表现与58位国际皮肤科医师的表现进行了比较,发现CNN与皮肤科专家相比,漏掉了更少的黑色素瘤,误诊了少量良性痣。
CNN是一种人造神经网络,它受工作中的生物学过程的启发,当大脑中的神经细胞(神经元)相互连接并对眼睛所见产生反应,能够从它“看到”的图像中快速学习,并从它学到的改进其性能的过程中教导自己(一种称为机器学习的过程)。
该研究的第一作者,德国海德堡大学皮肤病学系高级管理医师Holger Haenssle教授解释说:“CNN像小孩的大脑一样工作,为了训练它,我们向CNN展示了超过10万恶性和良性皮肤癌和痣的图像,并指出每张图像的诊断,只使用皮肤镜图像,即放大倍数为10倍的病变图像,在每一个训练图像中,CNN提高了区分良性和恶性病变的能力。在完成训练后,我们从海德堡图书馆创建了两组测试图像,这些图像从未用过,因此对CNN来说是未知的。一组300幅图像测试CNN的性能。我们选择了100个最困难的病变来测试真皮肤科医生,与CNN的结果相对比。”
小组邀请了来自世界各地的皮肤科医生,来自全球17个国家的58位同意进行测试。其中17人(29%)在皮肤镜检方面的经历不到两年,11人(19%)有2至5年的经验,30人(52%)拥有超过5年的专家经验。
实验要求皮肤科医生首先根据皮肤镜检查(第一级)对恶性黑色素瘤或良性痣做出诊断,并决定如何管理病情(手术,短期随访或无需采取措施)。然后,四周后,他们获得了关于患者的临床信息(包括年龄,性别和病变部位)以及同样100例患者的特写图像(II级),并再次要求做出诊断和管理决策。
在第一级,皮肤科医生准确地检测到平均86.6%的黑素瘤,并正确地确定了平均71.3%的非恶性病变。然而,当CNN调整到与医生相同的水平以正确识别良性痣(71.3%)时,CNN检测到95%的黑素瘤。在第二级,皮肤科医生改善了他们的表现,准确地诊断了88.9%的恶性黑素瘤和75.7%的非癌症。
Haenssle教授说:“CNN漏掉更少的黑色素瘤,这意味着它比皮肤科医生的敏感度更高,而且它误诊了更少的良性痣,意味着它具有更高的特异性,这将减少不必要的手术。“
当皮肤科医生在第二级接受更多的临床信息和图像时,他们的诊断性能得到改善,然而,CNN仍然仅依靠皮肤镜像进行工作,没有额外的临床信息,表现依然超出医师的诊断能力。
专家皮肤科医生比经验较少的皮肤科医生表现得更好,并且更善于发现恶性黑素瘤。
然而,他们在这两个层次上做出正确诊断的平均能力仍然比CNN差。
“这些研究结果表明,CNN能够比皮肤科医生,包括经过广泛培训的专家在检测黑素瘤的任务中表现更出色,”他说。
恶性黑色素瘤的发病率正在增加,估计全球每年有232,000例新病例和约55,500例死亡病例。如果在早期发现,是治愈的,但许多病例只有在癌症更加严重且难以治疗时才能被诊断。
Haenssle教授说:“我参与了近20年来在可治愈阶段发现黑色素瘤的研究项目,我和我正在关注的非侵入性技术可能有助于医生不会漏掉黑色素瘤,例如,在进行皮肤癌筛查时,当我遇到最近关于深度学习算法的报告时,它们在特定任务中胜过了人类专家,我立即知道我们必须探索这些用于诊断黑色素瘤的人工智能算法。”
研究人员并没有设想CNN将从皮肤科医生手中接管皮肤癌的诊断,但可以将其用作额外的辅助手段。
“CNN可能会为参与皮肤癌筛查的医生提供帮助,辅助他们决定是否对病变进行活检。大多数皮肤科医师已经使用数字皮肤镜系统对病变进行成像和存储以便进行记录和随访。快速评估存储的图像以获取关于黑色素瘤概率的“专家意见”,目前我们正在计划进行前瞻性研究,以评估CNN对医生和患者的实际影响。”
这项研究有一些局限性,其中包括皮肤科医生处于无需做出“决定生死”的人造环境中;测试集不包括全面的皮肤病变;来自非高加索人皮肤类型和遗传背景的验证图像较少;医生可能并不总能遵循他们不信任的CNN的建议。
在一篇社论中, Victoria Mar博士(澳大利亚墨尔本莫纳什大学)和H. Peter Soyer教授(澳大利亚布里斯班昆士兰大学)写道:“目前,黑色素瘤的诊断准确性取决于经验和培训...... Haenssle等人已经证明,使用卷积神经网络的计算机算法胜过了大多数58位测试的皮肤科医生.....这表明人工智能(AI)有望实现更加标准化的诊断准确性水平,这样所有的人,无论他们住在哪里,或者他们遇到了哪个医生,都能够获得可靠的诊断评估。”
他们强调了在AI可能成为诊所标准之前需要解决的一些问题,包括难以在手指,脚趾和头皮等部位对一些黑色素瘤进行成像,以及如何充分训练AI以识别未知的非典型性黑色素瘤。
他们得出结论:“目前,没有什么可以替代全面的临床检查,但是二维和三维全身照相能够捕获大约90%至95%的皮肤表面,并且我们预计成像技术呈指数级发展,自动化诊断将改变皮肤病学的诊断范式,然而,将这项令人兴奋的技术安全地应用于常规临床护理之前,还有很多工作要做。”