影像科正在经历一种范式转变,即使用人工智能与机器集成以及深度学习与影像组学更好地定义组织特征,从而实现计算机科学与影像学的共生关系。研究的目标是使用集成的深度学习和具有影像学参数的影像组学来为患者进行个性化诊断。本文概述了影像学精准医学背景下历史和当前的深度学习和影像组学方法。 本文通过“深度学习”、“影像组学”、“机器学习”、“人工智能”、“卷积神经网络”、“生成对抗网络”、“自动编码器”、“深度信念网络”、“强化学习”和“多参数 MRI'在 PubMed、ArXiv、Scopus、CVPR、SPIE、IEEE Xplore 和 NIPS 中进行文献检索。 结论:总而言之,深度学习和影像组学都是两种快速发展的技术,两者将在未来联合起来产生一个统一的临床决策支持框架,有望彻底改变精准医学领域。本文发表在expert review of precision medicine and drug development杂志。 1、介绍
影像成像方法用于扫描身体的不同区域,以检测和表征潜在的异常病理并帮助临床诊断。这些影像成像程序可以通过局部或全身扫描产生大量复杂的数字成像数据,这会使“读取和解释”图像数据变得非常具有挑战性。计算机科学的发展将导致影像学在医学领域使用先进的计算方法发生范式转变 [1–7].这些计算方法包括先进的机器和深度学习算法 [8,9]加上图像纹理的定量测量,称为影像组学[10–13].通过结合这些计算方法,未来的影像科室将形成计算机科学家和影像科医生(人类专家)之间的独特合作。这种合作将使算法能够在影像学诊断决策制定的各个方面协助影像科医生,例如:识别、分割、不同组织类型的表征以及优先诊断。例如,大脑、胸部、腹部、骨盆和乳房等大型成像数据集可以通过使用深度学习方法快速分类来分为不同的组,影像科医生首先查看潜在的“更差”病例,从而增加影像科医师的准确率和信心。可以进一步开发使用机器学习的其他数据挖掘方法,以将影像学参数与使用电子健康记录从不同来源(如病理学和临床病史)提取的其他信息相结合 [14–17].这些整合的数据类型,将使临床医生更全面地了解患者的健康状况,有助于更准确的诊断并提高对疾病复杂性的理解。当数据汇集在一起时,可以实现个性化的治疗计划和精确的疾病预后,如图1所示.计算影像学的目标是提取图像中的所有定性和定量信息,并开发潜在的非侵入性生物标志物,用于检测和表征患者的疾病。深度学习和影像组学是实现这一目标的计算放射学的新兴领域。
深度学习是一个新的研究领域,涉及受我们大脑中的生物神经网络启发而开发的深度人工神经网络 [4,6,18–42].在影像学中,深度神经网络与生物神经网络一样,试图学习影像学数据的内在表示,例如,在MRI中,诸如脑脊液等流体在 T1WI上是暗的,而在T2WI上是亮的。此信息可以训练深度学习算法来识别模式并执行准确的分割。深度学习在多个领域都取得了优异的成绩,例如。对象检测和识别、文本生成、音乐创作和自动驾驶等等 [1,2,43–49].近年来,深度学习已成为计算机辅助临床和影像决策支持领域的一个活跃研究,取得了一些出色的初步成果以及最新的研究发现。
影像组学是一种纹理数学结构,可以捕获感兴趣组织的空间外观(形状和纹理)在不同类型的图像上使用纹理[10–13,50–53].最近还有一篇相关的综述也说明纹理特征在某些应用中与组织生物学相关 [影像组学特征的生物学意义 54].传统意义上,影像组学特征提供有关放射图像感兴趣区域内的灰度模式、像素间关系、形状和频谱的信息。[50–53,55,56].
将影像组学或深度学习算法从研究成功转化为精准医学临床实践的主要障碍之一就是可解释性。例如,在影像组学中,如果熵(一阶,它是异质性/无序性的量度)或灰度共生矩阵 (GLCM) 熵(基于灰度级相互关系的异质性/无序性的高阶量度某些社区)特征被测量为 6.5,如果这些指标没有控制或正常组织熵值,则很难将生物学意义附加到该熵值。影像组学指标的相同值同质或者异质的判断取决于所选的箱子数量、ROI 的大小以及其他预处理步骤,例如图像过滤,这些都会对值产生影响(请参阅以下)。
同样,由于深度学习本质上是一个“黑匣子”,当该方法将底层组织分割并预测为恶性或良性时,深度学习不会提供其预测背后的解释。医生的可解释性将基于算法以及他们是否会“信任”结果,这是目前的主要挑战。本文回顾了影像组学和深度学习技术,概述了目前最先进的精准医疗算法及其局限性,并对这两种技术在精准医疗中的潜在未来进行了展望。
图1 个性化放射诊断和预后的概念计算放射学框架。
该框架有三个主要组成部分——图像分割、特征提取和综合临床决策支持模型。 2、深度学习
近年来,随着高级优化技术的发展和计算效率的提高,深度学习技术重新流行起来。深度学习已经开始在现代社会的许多不同方面发挥不可或缺的作用,并在各种领域产生了出色的成果,例如物体检测和识别、文本生成、音乐创作和自动驾驶等 [2,43–46,48,49].先进的深度学习将在不久的将来使用计算机辅助临床和放射决策支持对精准医学产生影响。这些方法将概述用于训练、测试和验证临床测试的新方法,以更好地整合医学信息,并为诊断提供新的可视化工具。我们将重点关注深度学习方法的概述和最新技术水平。
从历史上看,深度学习方法是计算机科学中机器学习算法的一个子集。简而言之,机器学习的目标是学习特征并将这些特征转化为类标签以进行分割或分类。机器学习算法在本质上是有监督的或无监督的,线性的或非线性的[57].深度学习和传统机器学习算法之间的主要区别在于,深度学习算法不需要中间特征提取或工程步骤来学习输入 x(例如,放射图像上的灰度强度值)和相应的标签 y(例如,与这些强度值对应的组织类型)。
从概念上讲,机器学习算法使用概率分布 p 在 x 和 y 上对输入 x 和标签 y 之间的关系进行建模,一般来说,学习算法可以根据 p [57,58]。生成模型学习联合概率分布 (x, y) 以估计后验概率 p(y|x)。生成深度学习算法的一些例子包括:生成对抗网络、变分自动编码器和深度信念网络 [40,59]。相比之下,判别模型直接估计后验概率 p(y|x) 而无需计算中间环节概率分布。换句话说,判别模型学习 x 和 y 之间的直接映射。卷积神经网络、堆叠自动编码器和多层感知器是判别式深度学习算法的典型示例 [45,46] 。如果问题要求我们只根据 x 预测标签 y,那么判别模型可能是更好的选择,因为它们不关心 (x, y) 的建模,更有效地为 P(y| x) 建模参数,从而产生一个准确率更高的分类器。但是,如果输入 x 包含大量缺失值或数据点并且需要数据插补,则可能无法使用判别模型。此外,生成模型允许生成新的合成数据并模拟输入数据中的不同关系。例如,如果目标是将病变分类为良性或恶性,则判别式深度学习可能是更好的选择。然而,如果我们的目标是识别病变的内在特征并模拟它们在患者群体中的分布,那么更好的算法选择可能是生成式深度学习算法之一。下面讨论应用于精准医学的常用判别式和生成式深度学习算法。图2简要介绍了深度学习领域的主要进展历史和时间表。