乳腺癌是全球女性最常见的恶性肿瘤之一,也是女性癌症相关死亡的重要原因。全球乳腺癌发病率持续上升,2020年病例超过230万例,预计到2040年将新增约300万例。早期、准确地识别恶性乳腺病灶,对于改善患者预后至关重要。真实临床中,患者一般是在筛查或体检中发现乳腺结节,随后通过超声、钼靶、MRI等影像检查进行风险评估,再根据BI-RADS分类决定是否需要穿刺活检。其中BI-RADS 4类病灶提示恶性风险约为 2%–95%,通常建议进行穿刺活检。这一风险区间非常宽,临床上大量BI-RADS 4病灶最终被证实为良性,从而带来了疼痛、出血、感染、焦虑、医疗费用增加和过度诊疗等问题。 近日,上海科技大学及其他大学和医疗机构合作在杂志Nature Biomedical Engineering上发表了一篇题为“A deep learning system for non-invasive breast cancer diagnosis with multimodal data”的文章。文章提出了一个名为 BINDS的多模态乳腺癌无创诊断系统。该系统整合多视角超声、多视角钼靶、多序列MRI,支持灵活的模态组合,并采用两阶段诊断流程,实现乳腺病灶恶性风险评估和癌症亚型分类。在两阶段诊断流程中,BINDS在内部测试集中癌症风险评估AUROC达到0.973,外部测试集中达到0.941,并可帮助放射科医生减少良性病灶活检,最高可减少32.4%。 图片来源:Nature Biomedical Engineering 主要内容 两阶段诊断、多模态乳腺癌诊断系统BINDS概述 乳腺影像诊断具有高度互补性。超声、钼靶和MRI对致密乳腺、实体结节、微钙化以及非浸润性病变的敏感性上各有所长。临床上乳腺癌诊断不是依赖单一检查,通常先进行超声和钼靶等放射学检查,再根据结果进入MRI评估或病理活检流程。 BINDS的系统输入包括多视角超声、多视角钼靶、多序列MRI(图b)。模型输出包括癌症风险评估以及癌症亚型分类。它可以在训练和验证中支持灵活的模态组合,并采用两阶段诊断流程,使AI系统更接近真实临床工作流。BINDS在第一阶段使用超声和/或钼靶进行初步诊断,对应最常见的初诊流程。如果第一阶段输出足够明确,则直接给出风险判断;如果模型认为结果不确定,则进入第二阶段,再加入MRI进行更全面的多模态评估,避免把昂贵MRI用于所有初诊患者。 BINDS的临床工作流程概述。图片来源:Nature Biomedical Engineering BINDS的单模态性能表现 本研究构建了较大规模的多模态乳腺影像数据集。研究共纳入27048名参与者,数据来自中国8家医疗中心和7个公开数据集。不同中心之间数据结构差异很大,有些中心以超声为主,有些中心MRI比例高,有些外部亚型队列几乎全是恶性病例。这种异质性更接近真实世界多中心场景。 作者评估了BINDS在单一模态下的表现。结果显示,内部测试队列中,癌症风险评估AUROC分别为0.912(超声),0.913(钼靶),0.953(MRI)。外部测试队列1中,AUROC分别为0.876(超声),0.877(钼靶)和0.909(MRI)。结果说明,即使是单模态输入,BINDS在外部队列上仍保持较高性能。 BINDS在单模态输入下的性能表现。图片来源:Nature Biomedical Engineering BINDS多模态输入明显提升诊断性能,两阶段流程表现最好 作者评估了更接近临床路径的多模态输入。结果显示,在超声+钼靶的双模态中,癌症风险评估AUROC为0.932(内部测试队列)以及0.898(外部测试队列1)。在BINDS的两阶段诊断中,模型先用超声和/或钼靶判断,不确定时加入MRI。结果显示,癌症风险评估AUROC达到0.973(内部测试队列)以及0.941(外部测试队列1)。对于癌症亚型分类,两阶段流程也表现最好。内部测试队列AUROC达到0.861,外部测试队列2 AUROC达到0.790(如下图)。这说明,BINDS利用了不同模态之间的互补信息,改善了诊断性能。 BINDS 在多模态输入下的表现。图片来源:Nature Biomedical Engineering 不同模态在冲突场景中的贡献 临床上常见超声、钼靶和MRI意见不一致的场景。在内部测试队列中,超声和钼靶预测不一致的病例占17.2%。在这些病例中,双模态模型仍能正确预测84.4%。同样,双模态与三模态预测不一致的病例占8.7%,当加入MRI后,三模态模型在这些冲突病例中正确率为75.5%。作者分析了不同模态在冲突场景中的贡献。分析结果显示,当超声和钼靶冲突时,模型更依赖钼靶,而在三模态场景中,MRI贡献最大(图c)。 不同模态在冲突场景中的贡献。图片来源:Nature Biomedical Engineering Reader study结果表明,AI辅助能显著减少良性病灶活检 Reader study选择了内部测试队列中的208个BI-RADS 4病灶,其中104个良性、104个恶性,由放射科医生进行读片,判断良恶性,以及是否建议穿刺活检。结果显示,在单模态诊断中,BINDS表现与放射科医生大体相当;在双模态和三模态诊断中,BINDS优于初级医生。尤其在三模态诊断中,BINDS准确率为0.933,高于初级医生,并接近高级医生水平。 作者还进行了AI辅助的诊断研究,评估了AI对放射科医生工作表现的影响(如下表)。结果显示,加入AI预测和热图后,医生准确率普遍提高,同时良性病灶活检数量下降,而恶性病灶活检基本保持不变。在双模态诊断中,初级医生准确率从0.875提高到0.933,良性病灶活检减少22.6%;高级医生准确率从0.904 提高到0.927,良性活检减少17.4%。在三模态诊断中,初级医生准确率从0.894提高到0.942,良性活检减少22.5%;高级医生准确率从0.923提高到0.957,良性活检减少32.4%。与此同时,恶性病灶活检数基本维持在104例。这表明,AI辅助可在不降低恶性病灶检出前提下,减少低风险良性病灶的不必要穿刺。 reader study结果描述。图片来源:Nature Biomedical Engineering 作者提出了一个多模态乳腺癌AI诊断系统BINDS。它整合多视角超声、多视角钼靶、多序列MRI,采用两阶段诊断流程,先用超声和/或钼靶进行初筛,对不确定病例再加入MRI。这种设计比传统单模态AI更接近真实临床工作流。BINDS在癌症风险评估中表现突出。两阶段流程在内部测试集AUROC达到0.973,外部测试集达到0.941。在癌症亚型分类中,内部和外部AUROC分别为0.861和0.790。更重要的是,AI辅助医生诊断可显著减少良性病灶活检,最高减少32.4%,同时基本维持恶性病灶活检率。 但这项研究仍有局限性。首先,此研究是回顾性设计,其真正临床价值仍需前瞻性试验确认。其次,院内数据主要来自中国医疗中心,在不同国家、不同种族、不同设备品牌和不同筛查体系中的表现仍需验证。最后,当前模型没有加入Doppler等高级超声信息,这可能进一步提高初诊阶段性能,减少对MRI的依赖。总之,这篇文章交给AI一个更合理的定位,即帮助医生更精确判断哪些BI-RADS 4病灶更需要活检,在不牺牲恶性检出的前提下,减少一部分良性病灶的不必要活检。这对患者体验、医疗成本和乳腺影像工作流都有现实意义。 注:本文内容仅供行业动态参考,不构成任何投资建议或临床医疗决策依据。 |
/3