8月27日,中国解放军总医院、中国医学科学院肿瘤医院、北京协和医院联合透彻影像开展的人工智能胃癌病理辅助诊断多中心研究成果「Clinically applicable histopathological diagnosis system for gastriccancer detection using deep learning」在Nature Communications发表。这是中国研究团队在病理人工智能领域发表的顶级学术成果,也是全球首个可应用于复杂器官临床病理诊断的人工智能系统。 病理诊断是肿瘤类疾病的最终诊断,被称为医学诊断的“金标准”,病理医师被称为“医生的医生”。病理医师的责任重大,对疾病的诊断不能出现差错。病理医师不仅要有丰富的临床经验,还必须掌握影像学、分子学等方面的知识,病理医师的成长期往往需要5到10年的时间。目前全国有执照的病理医师在1万人左右,人才缺口高达近9万人。胃癌是威胁人类健康的恶性肿瘤之一,病理诊断在胃部疾病早期筛查和精准诊断发挥着重要的作用,准确的病理学诊断能够显著地降低胃癌的死亡率。在全球范围内,由于病理医师人数的严重缺乏,加之胃部活检和手术标本的样本量大,胃部病理的诊断工作为病理科带来了巨大的压力,这一矛盾在胃癌发病率较高的亚洲愈加凸显。为了满足临床治疗的需求,快速提供诊断结果,病理医师承担着超负荷的诊断工作量,误诊的发生在所难免。
伴随着病理人工智能的不断发展,数字病理的价值被最大化发挥,医师通过全数字切片能够获得机器的辅助诊断结果,在提高诊断效率的同时有效降低漏诊。病理影像具有文件体积大、信息量丰富、噪声种类多等特点,需要设计强大的人工智能模型对其进行建模,同时需要构建高效可扩展的存储和运算系统,对影像进行快速分析。 可用于临床诊断的病理辅助诊断系统,需要满足以下几个条件:(1)深度学习模型需要通过多款病理切片扫描仪所获得数千张连续样本的测试,敏感度应当接近100%,特异性超过80%。(2)通过人工智能系统的辅助,病理医师在不延长诊断时效的基础上,能够提高诊断的准确率。通过对模型的深入分析,我们可以知晓人工智能的优势与劣势,从而让病理医师建立与人工智能的基础信任。(3)人工智能辅助诊断系统需要经过来自多家医院病理切片的多中心验证,以确保系统在不同医院运行时的稳定性。虽然近些年来病理人工智能领域取得了一定的研究进展,但是均无法达到临床应用的标准。在这个工作中,研究人员报道了已在解放军总医院临床应用的胃癌病理辅助诊断系统。该系统在解放军总医院超过3000张真实世界测试切片上达到了接近100%的灵敏度和80.6%的特异性,这些切片使用了三款不同品牌的切片扫描仪进行了数字化。通过人机协同实验与预测结果的细致分析,研究人员证实该系统能够帮助病理学家提高诊断准确率、防止误诊。与此同时,通过医科院肿瘤医院与北京协和医院样本的多中心测试,研究人员证明了该系统的稳定性。 图1. 深度学习模型训练与测试框架,本研究采用深度图像分割模型,并证明分割相比分类模型,具有更好的准确率、可解释性及运算效率
图2. 基于iPad和Apple Pencil的标注工具,能够快速完成病理影像的标注过程,并内置严格的审核流程
12名资深病理医师参与了本研究的标注,其中10名主治/副主任医师进行一审和二审,所有样本由石怀银主任与宋志刚主任进行最终的审核。整套标注流程在基于iPad和Apple Pencil的标注工具Thorough WisdomTM| 透彻汇智进行,深度学习模型建立后,研究人员使用分布式病理辅助诊断系统Thorough InsightsTM| 透彻洞察进行了解放军总医院(3212张)、医科院肿瘤医院(987张)与北京协和医院(595张)临床连续样本的大规模测试。
图3. 深度学习模型在解放军总医院数据上的表现,在三个月的连续样本上,模型展示出了较好的准确率,与此同时,模型在三款不同品牌的切片扫描仪上的表现较为稳定基于图像分割技术的深度神经网络在解放军总医院的连续胃部样本上达到了99.6%的敏感度和84.3%的特异性,仅有一张阳性切片预测概率低于严格的阈值,根据双阈值策略,被划入待审核样本,交予病理医师审核。在所有样本上,人工智能系统均能够以较高的敏感度提示出癌变区域,从而防止漏诊的发生。通过对比模型在三款病理切片扫描仪上的表现,可以看到模型均表现出极高的敏感度和超过80%的特异性。这表明系统具有良好的兼容性,在采用不同品牌的扫描仪的医院终端均可以使用。
图4. 模型预测结果,癌区使用热力图来表示 图5. 图像分割与分类模型预测结果对比,能够看到图像分割模型能够更加清晰地展示病变区域人工智能系统不仅可以作为辅助病理医师的工具,而且可以提供有效的第二意见。在病理诊断中,疑难样本通常会使用免疫组化在进行更深入的诊断。深度学习模型在这些样本上能够达到超过80%的准确率,并正确提示出了高风险区域,指导病理医师执行免疫组化等进一步诊断。
图6. 多中心测试结果,模型在医科院肿瘤医院与北京协和医院的样本上获得了接近100%的敏感度和超过90%的特异性 经过多中心测试,深度学习模型在医科院肿瘤医院与北京协和医院的样本上,能够达到接近100%的敏感度和超过93%的特异性,稳定性卓越。为了验证人工智能系统在临床诊断中的表现,研究团队邀请了12名初级病理医生参与了人机协同测试。12名医生被随机分为显微镜组、数字切片组与人工智能辅助组,并施加了不同强度的压力(不限制诊断时间 vs. 限制一个小时的诊断时间)。研究发现,加入时间约束后,显微镜组与数字切片组的医生均呈现出漏诊率的增加,而人工智能的辅助显著提升了医生诊断的稳定性,诊断敏感度得以保障。 人工智能系统能够在有限的诊断时间内,保障诊断质量,有效防止漏诊的发生。目前,人工智能辅助诊断系统已在数十家大型三甲医院大规模应用,未来将会成为病理诊断常规辅助工具,惠及越来越多的病理医师。本研究所提出的方法论,适用于所有器官病理人工智能系统的建立,能够帮助研究人员加速智慧病理的研发进程,进而造福更多的患者。 展望未来的病理科,数字病理与人工智能将推动传统病理走向智慧病理时代。病理医师可以将一些重复、繁锁的病理诊断工作交由人工智能辅助诊断系统完成。从而让病理医师有更多的时间进行复杂疾病的诊治和前沿领域的研究,推动医疗技术的发展。
|