立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 273|回复: 4

[分享] 液体活检将如何改变癌症诊疗?

[复制链接]
发表于 2025-3-19 16:11 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
原文:液体活检将如何改变癌症诊疗?微流控技术推动技术突破液体活检:强大的癌症诊疗新手段,蕴含巨大的市场机遇
癌症,已成为现代社会日益关注的新焦点。人口老龄化、生活方式以及环境等多种因素正推动癌症高发。根据世界卫生组织的数据,全球范围内1/6的人口死亡源自癌症,大约有1/2的人会在整个生命周期中引发各种各样的癌症。癌细胞是基因发生突变的细胞;为了研究每种癌症的机理并确定最合适的诊疗方法,这些癌细胞都需要进行分析研究。
据麦姆斯咨询介绍,传统的活检方法,需要通过侵入性手术获取肿瘤的部分组织。然而,这些方法成本高昂,且对于患者来说非常痛苦,因而无法进行定期常规操作,以监测肿瘤发展,提高长期的诊疗效果。现在,“液体活检”技术的出现,使我们得以摒弃过去的侵入性分析方法。



原文地址:https://www.zhihu.com/question/286063345
楼主热帖
回复

使用道具 举报

发表于 2025-3-19 16:12 | 显示全部楼层

Basic Information


  • 英文标题:Multimodal integration of liquid biopsy and radiology for the noninvasive diagnosis of gallbladder cancer and benign disorders
  • 中文标题:液体活检与影像学的多模态整合用于非侵入性诊断胆囊癌及良性疾病
  • 发表日期:10 March 2025
  • 文章类型:Article
  • 所属期刊:Cancer Cell
  • 文章作者:Mao Yang | Yingbin Liu
  • 文章链接:https://www.sciencedirect.com/science/article/pii/S1535610825000637
Highlights

Para_01


  • 大规模的循环游离DNA在胆囊癌和胆囊良性病变中的突变图谱被展示
  • 液体活检结合放射学特征能够实现GBOLs(推测为胆囊相关病变)的非侵入性分类
  • 内部和外部验证突显了该模型的普适性和鲁棒性
  • 基于GBCseeker的风险分层优化了GBOLs的手术决策
Summary

Para_01


  • 胆囊癌(GBC)经常在影像学图像中模仿胆囊良性病变(GBBLs),导致术前误诊。
  • 为了解决这一挑战,我们发起了一项前瞻性、多中心临床试验(ChicCTR2100049249),并提出了一种多模式、非侵入性的诊断模型,以区分GBC与GBBLs。
  • 共有来自中国7个省份11家医疗机构的301名被诊断为胆囊占位性病变(GBOLs)的患者参与,并被分为发现队列和独立外部验证队列。
  • 基于细胞游离DNA(cfDNA)遗传特征、影像组特征和临床信息,创建了一种人工智能(AI)集成模型,称为GBCseeker。
  • 该模型在区分GBC与GBBL患者的准确性方面表现优异(发现队列中的准确率为93.33%,外部验证队列中的准确率为87.76%),可减少外科医生的诊断错误56.24%。
  • 此外,该模型将GBOL患者重新分类为三类,以指导手术选择。
  • 总体而言,我们的研究建立了一个用于术前诊断GBC的工具,有助于手术决策。
Graphical abstract



Keywords


  • gallbladder cancer; circulating cell-free DNA; radiomics; multimodal model; machine learning; artificial intelligence
Introduction

Para_01


  • 胆囊癌(GBC)是最常见的恶性程度很高的胆道癌类型。
  • GBC的发病率在全球范围内差异很大,在中国是发病率最高的国家之一。
  • 尽管早期GBC(I期)患者的5年总体生存率(OS)可以达到62%-75%,
  • 但总体而言,GBC的OS率仅为5%,因为大多数GBC患者是在晚期诊断出来的,错过了手术治疗的机会。
  • 与大多数癌症类型患者主要在术前确诊不同,只有不到一半(30%-55%)的GBC患者基于实验室和放射学检查结果在术前被诊断出来。
  • 这是因为,在发生转移之前,GBC通常与大多数胆囊良性病变(GBBLs)具有相似的影像学表现和略微升高的肿瘤标志物水平。
  • 在这些占据胆囊的病变(GBOLs)中,一些恶性肿瘤在手术过程中被发现或通过病理检查确认;这类患者被归类为偶然性胆囊癌(IGBC),
  • 这通常需要补充根治性手术。
  • 相反,一些术前怀疑为GBC,术后证实为良性病变的患者接受了不必要的根治性手术治疗。
  • 因此,一种能够有效提高疑似GBC诊断准确性的非侵入性方法对于GBOLs患者的诊断和治疗策略至关重要。
Para_02


  • 循环血浆游离DNA(cfDNA)为基础的液体活检是一种非侵入性采样技术,可以通过采集外周血样本获得疾病的基因特征。
  • 循环cfDNA来源于细胞凋亡和坏死细胞释放到血液中的细胞外DNA。
  • 许多研究表明,基于cfDNA的特定分子特征,包括单核苷酸变异、拷贝数变异、DNA甲基化和片段特征,可以代表原发疾病病变,并作为各种疾病的生物标志物。
  • 因此,携带有肿瘤细胞和组织遗传改变的cfDNA在肿瘤学研究中引起了相当大的关注,因为它们在癌症筛查、早期诊断、靶向治疗和预测癌症预后方面具有潜力。
  • 鉴于用于测试的DNA量很少,cfDNA中特定基因或基因面板检测的敏感性远高于其他常规检测方法,如影像学和肿瘤蛋白标志物检测。
  • 然而,迄今为止,在胆道癌(BTC)研究领域仅报告了少数基于cfDNA的突变图谱。
  • 此外,这些研究的结果仅证明了通过下一代测序(NGS)进行cfDNA检测的可行性以及cfDNA突变谱与肿瘤组织突变信息的一致性。
  • 因此,需要进一步调查循环cfDNA在GBC诊断和治疗研究中的应用以解决相关问题。
Para_03


  • 目前,放射影像学是胆囊疾病最重要的诊断工具之一。
  • 除了典型的胆囊结石外,GBBLs 常伴有管腔内病变和局部(或弥漫性)壁增厚,在影像上类似于 GBC 的放射影像变化。
  • 因此,放射科医生和外科医生评估不同 GBOLs 恶性风险相当具有挑战性。
  • 基于深度学习算法的影像组学模型旨在提取大量影像特征并通过快速分析这些特征来发挥作用;此类模型已被证明对于区分 GBC 和 GBBLs 是有效的。
  • 基于先进的人工智能(AI)的多组学整合应用显示有望为其他癌症类型的异常进行非侵入性分类,但在 GBC 中其实践和有效性仍不清楚。
Para_04


  • 在这项研究中,我们通过基于捕获的、针对111个基因的NGS方法对循环游离DNA进行了特征分析和区分,以识别胆囊癌(GBC)和胆囊良性病变(GBBLs)之间的遗传特征。
  • 随后,我们开发了一种基于循环游离DNA的模型(CBM),并将该模型与一种人工智能辅助的影像组学模型(RM)相结合,命名为GBCseeker,用于辅助胆囊癌和胆囊良性病变的诊断。
  • GBCseeker是一种有价值的工具,有助于诊断这些疾病,并且对患者有益。
Results

Cohorts composition

队列组成
Para_01


  • 从2021年8月1日到2024年7月31日,共筛查了338名GBOL患者以确定其资格,其中301名患者被纳入这项前瞻性研究。
  • 来自仁济医院的301名符合条件的患者中有203名被视为用于模型构建(142名患者用于模型训练)和初步验证(61名患者用于模型测试)的发现队列(ChicCTR2100049249)。
  • 训练集(n = 142)包括所有参与者的样本和142名参与者中的139人的计算机断层扫描(CT)图像。
  • 测试集(n = 61)包含61份样本和60份CT图像。
  • 从2022年8月1日至2024年7月31日,在中国7个省份的10家医院又招募了98名参与者作为外部验证队列,进一步验证该模型(ChicCTR2100049249 和 NCT04183712)(图1)。


图片说明 ◉ 图1。研究和队列设计的示意图(A)患者招募和队列设计。我们研究中共招募了2021年8月至2024年7月期间来自多家医疗中心的301名放射学诊断为GBOL的患者。发现队列由来自仁济医院的患者组成,独立外部验证队列由来自另外10家医院的患者组成。(B)研究设计流程图。
Patient characteristics

患者特征
Para_01


  • 在最初的来自仁济医院的发现队列中,我们分析了203名符合条件患者的血浆样本,包括141名胆囊癌患者和62名胆囊良性病变患者(18名慢性活动性胆囊炎[CAC]患者,9名胆囊腺肌瘤病[GA]患者,12名黄色肉芽肿性胆囊炎[XGC]患者,16名胆囊腺瘤[GBA]患者,以及7名胆囊息肉[GBPs]患者)。
  • 我们的研究纳入了胆囊癌的全部肿瘤分期,并且晚期患者(AJCC IVA和IVB)占大多数(40.4%)。所有患者的基线特征总结在表1中。
  • 女性胆囊癌的发病率几乎是男性的两倍。相比之下,在胆囊良性病变患者中没有观察到这种基于性别的分布模式。
  • 肥胖、高龄和胆结石被认为是胆囊癌的高风险因素;然而,在我们的研究中,两组之间的体质指数(BMI)、年龄或胆石病史没有显著差异。
  • 有趣的是,胆结石与良性病变的关联比与胆囊癌的关联更为频繁(胆囊良性病变:48.4%对胆囊癌:39.0%)。
  • 胆囊癌患者的CA19-9水平中位数高于胆囊良性病变患者的水平(36.5 vs. 20.0,p = 0.0077)。
  • 胆囊壁增厚主要发生在胆囊良性病变患者中,而胆囊壁增厚和腔内病变在胆囊癌和胆囊良性病变患者中同样常见。
  • 在62名胆囊良性病变患者中进行的手术中,单纯胆囊切除术(46例)占大多数(74.2%;腹腔镜手术53.2%,开放式手术21.0%);然而,由于误诊,其余16名患者(25.8%)接受了根治性手术。
  • 在141名胆囊癌患者中,23名患者(16.3%)在胆囊切除术后被确认为浸润性胆囊癌。
  • 随后,这23名患者中有21名(91.3%)接受了补充手术(20次根治性手术和1次姑息性手术)。因此,在发现队列中,相当数量的胆囊良性病变患者(25.8%)接受了过度治疗,而16.3%的胆囊癌患者进行了延迟手术。
Prevalence of mutations in cfDNA

cfDNA中突变的流行情况
Para_01


  • 鉴于上述胆囊良性病变(GBBL)或胆囊癌(GBC)患者过度治疗或延迟治疗的结果,我们假设个体疾病的遗传特征导致了它们不同的临床结局。
  • 为了验证这一假设,我们主要关注发现队列中胆囊癌患者与良性对照组之间循环cfDNA的突变特征。
  • 收集血液样本以提取cfDNA。测序的cfDNA片段大小分布如图S1所示,GBC和GBBL样本的范围均为150至200 bp。
  • 如图2A所示,从收集的血液样本中提取的cfDNA浓度在GBC组中显著高于GBBL组(GBC:1.08 [0.76, 2.07] ng/μL vs. GBBL:0.59 [0.37, 0.84] ng/μL,p < 0.0001;图2A)。
  • 循环cfDNAs使用包含111个基因的设计NGS面板进行测序(表S1)。测序cfDNA的平均覆盖深度为29698×(范围4596×-62889×),目标区域覆盖分数均超过99%。
  • 在203个样本中的145个(71.43%)样本中可以检测到cfDNA突变,其中GBC组的比例显著高于GBBL组(78.01% vs. 56.45%,p = 0.0024;图2B)。
  • 为了评估突变特征,分析了基因从突变人群的前23%到后2%的排名突变景观(图2C)。
  • 与良性病变患者相比,恶性病变患者的突变基因显著更多(图2C和2D,p = 0.0006)。
  • 在这些基因中,DNMT3A和TP53是突变频率最高且分别出现在23%和18%的所有患者中的基因。
  • 有趣的是,与DNMT3A突变不同,TP53突变仅发生在GBC组而在GBBL组中未观察到。
  • 然后,我们通过评估最大变异等位基因频率(max VAF)来研究鉴定突变的临床相关性,该指标已与肿瘤驱动改变和病变质量的细胞数量有关。
  • GBC组的最大VAF大于GBBL组(图S2,p = 0.0030),并与肿瘤节点转移(TNM)分类阶段呈显著相关(图2E,r2 = 0.09574,p < 0.0001)。
  • 这些来自cfDNA的升高基因突变表明,cfDNA可能具有区分GBC和GBBL患者的价值。
  • 然后,我们评估了cfDNA和相应组织样本之间突变的一致性。从发现队列中随机收集并测序了46对组织-cfDNA样本(27个GBC,19个GBBL)。
  • 组织和血浆样本的匹配结果如图S3所示。在46个组织样本中的36个(78.26%)中鉴定出体细胞突变,这比配对的cfDNA样本(27/46,58.70%,图S3)多。
  • 在27名GBC患者中,17名患者(62.96%)的突变在组织和血浆中都被检测到;相反,在19名GBBL队列的患者中发现了7个一致性病例(36.84%)(21.05%在组织和血浆中都能检测到,15.79%在组织和血浆中都无法检测到)(图2F)。
  • 为进一步证明cfDNA测序的可靠性,我们还评估了GBC患者组织和血浆中突变的流行情况的相关性。
  • 组织DNA中最常突变的基因的频率与cfDNA中的显著相关(R2 = 0.7849;p < 0.0001;图2G)。
  • 我们的研究表明,cfDNA是一种可靠的检测组织遗传改变的方法,特别是在GBC方面。


图片说明 ◉ 图2. 发现队列中GBOLs患者的cfDNA突变分析(n = 203,恶性:141 vs 良性:62)(A) 恶性肿瘤与胆囊良性病变之间cfDNA浓度的差异。对非正态分布的数据应用了双侧Mann‒Whitney U检验。条形内的黑线表示中位数。中心线,中位数;条形,上下四分位数。(B) 恶性肿瘤与胆囊良性病变之间cfDNA检测率的比较。"阳性"表示至少检测到一个突变,"阴性"表示没有检测到突变。应用Fisher精确检验比较列联表数据。(C) GBOLs患者cfDNA的突变景观。右侧的条形表示显示基因的两组频率分布,左侧的条形表示每个显示基因的不同突变类型的分布。(D) 恶性肿瘤与胆囊良性病变之间突变数量的差异。对非正态分布的数据应用了双侧Mann-Whitney U检验。条形内的黑线表示中位数。中心线,中位数;条形,上下四分位数。(E) maxVAF与GBC的AJCC分期之间的相关性分析。对数据应用了双侧Spearman相关检验。条形内的橙色线表示非线性回归曲线。连接线表示回归曲线;条形限值表示95%置信区间。(F) 46名GBOL患者组织和血浆样本阳性检测的一致性。(G) GBC患者肿瘤组织DNA与循环肿瘤DNA(ctDNA)之间突变频率的相关性分析。对数据应用了双侧Pearson相关检验。条形内的黄色线表示简单线性回归趋势线。连接线表示回归趋势线;条形限值表示95%置信区间。另见图S1-S3和表S1。
Construction of the cfDNA-based model

基于cfDNA的模型构建
Para_01


  • 接下来,为了进一步探讨个体遗传特征是否可以区分胆囊癌(GBC)和胆囊良性病变(GBBL),我们建立了一个基于cfDNA的诊断模型。
  • 在发现队列中(见图1B),选择了142名患者(约占203名同组比例相同的受试者的70%)作为训练子集来定义最佳特征并构建分类器,而剩余的61名患者则作为测试子集来评估堆叠模型的性能。
  • 我们探索了通过随机森林(RF)算法计算的重要性评分最高的前30个独特基因组特征(图3A)。
  • 为了达到最佳性能且使用最少的特征,我们分析了曲线下面积(AUC)值与顶级特征数量之间的关系。
  • 当顶级特征的数量增加到14时,AUC达到了一个平台期;向模型中加入更多特征并未显著提高AUC(图3B)。
  • 利用所选的基因特征,我们构建了4个基础模型(逻辑回归[LR]、RF、支持向量机[SVM]和极端梯度提升[XGB]),以及一个基于这四个模型的广义线性模型(GLM),该模型能够区分GBC和GBBL患者,AUC为0.92(95%置信区间[CI]:0.87–0.96,图S4)。
  • 由于GBOL患者的突变率较低,许多患者的基因特征被输入为null值,严重影响了模型性能。
  • 因此,我们加入了具有诊断潜力的临床变量(表1中的p < 0.05),包括CA19-9水平和性别,以优化模型性能。
  • 经过各种组合测试后,结合CA19-9水平和性别的基因组模型在训练集中产生了最大的AUC,为0.94(95% CI:0.90–0.98)(表S2),这显著高于仅使用基因组特征的初始模型(p = 0.0476,图3C)或仅使用临床特征的模型(p = 0.0278,图3C)。
  • 由基因特征、CA19-9和性别组成的模型被称为CBM。
  • 然后我们评估了CBM在测试子集中的可行性和可靠性,并生成了相应的受试者工作特征曲线(ROC)。
  • CBM正确诊断了61名患者中的50名,AUC为0.86(95% CI:0.76–0.97;敏感性85.71%,特异性73.68%;图3D)。
  • 为了更好地理解CBM每个组成部分的重要性,根据所有来自发现队列(n = 203)患者的Shapley加性解释(SHAP)值,解释了全部16个预测因子。
  • cfDNA浓度在区分GBC和GBBL患者方面排名最高,其次是TP53突变和CA19-9水平(图3E)。
  • 正如预期的那样,女性性别似乎是一个GBC的风险因素。
  • 与我们之前的研究结果一致(图2C),大多数突变与GBC相关,尤其是TP53、DNMT3A和PIK3CA突变(图3E)。
  • 有趣的是,KMT2D、PTCH1、TET2和PALB2基因的突变作为SHAP中的负值似乎对癌症有保护作用(图3E)。
  • 为了更精确地评估CBM,我们还获得了来自韩国一项已发表研究的cfDNA改变结果和临床信息。
  • 由于韩国队列的TP53突变频率高(80%)和cfDNA浓度高,所有25个病例均被正确预测,敏感性为100%(图S5),这证明了我们模型特征筛选的可靠性。
  • 然而,没有良性对照的数据,我们无法评估CBM在外国队列中的特异性。


图片说明 ◉ 图3。用于诊断GBOL患者的CBM的构建和解释(A)训练子集中重要性最高的前30个基因特征的排名。每个变量的重要性得分总和显示在柱状图顶部。(B)训练子集中特征数量与AUC值之间的关系。y轴显示AUC值,x轴显示相应的特征数量。非线性回归曲线由红线表示。AUC,曲线下面积。红色虚线表示顶级平均AUC值。(C)临床特征模型、cfDNA模型和CBM在区分GBC和GBBL患者方面的ROC曲线比较。AUC值使用DeLong检验进行比较。CI,置信区间。(D)CBM在区分GBC和GBBL患者方面的鉴别性能。左:CBM的ROC曲线,显示其在测试子集中区分GBC和GBBL患者的性能,AUC为0.86。CI,置信区间。右:混淆矩阵,显示每个样本的预测分布。(E)整个发现队列(n = 203)中CBM的16个变量的SHAP值。蜂巢图显示了每个特征在x轴下方的SHAP值分布,正SHAP值表示GBC风险增加,负SHAP值表示GBC风险降低。不同颜色代表变量值:红色表示高值,蓝色表示低值。由单个点组成的线的厚度对应于给定值的样本数量。上部x轴上的条形图显示了每个特征的平均SHAP值按重要性降序排列。另见图S4和S5以及表S2。
Construction of the radiomic model and multimodal integration

放射组学模型的构建和多模态整合
Para_01


  • 由于CBM在检测GBC方面的特异性不足(测试子集中14/19,73.68%,图3C),我们开发了一个具有自动分割模块和分类模块的RM来提供额外的评估指标。
  • 从发现队列中的199名患者(138名患有GBC,61名患有GBBL)的总共42,484个CT切片被收集并手动分割,以建立和评估RM。
  • 分割性能通过Dice系数(DC值)进行评估,该值表示预测输出与真实标签之间的重叠程度(图4A)。
  • 如图S6所示,在测试子集(n = 60)中的平均DC值为0.805(95%置信区间:0.777-0.832)。
  • 分割后,感兴趣区域(ROI)被获取并用于特征提取。
  • 从每个成像阶段提取了总共219个特征,包括形状、一阶、二阶和高阶特征(表S3)。
  • 在训练子集(n = 139)中选择了最重要的三个参数,使用最小绝对收缩和选择算子(LASSO)分类器(图4B)。
  • 随后,通过训练集中的引导森林算法构建了RM,并通过测试集中的ROC曲线分析评估其诊断能力(图4C)。
  • AUC值和混淆矩阵表明,RM的表现优于CBM,尤其是在特异性方面(RM 84.21% vs. CBM 73.68%,图4D;表2)。


图片说明 ◉ 图4。用于诊断GBOLs的RM和GBCseeker的构建与评估(A)图像分割过程;上部:发现队列中的GBC患者;下部:发现队列中的GBBL患者。(B)219个放射组学特征的LASSO系数谱。使用非线性网格尺度计算了LASSO的正则化路径。x轴表示惩罚参数,y轴表示特征的相关系数。随着惩罚参数的增加,所有特征的相关系数逐渐接近零,这意味着它们是不相关的。红色的垂直线代表通过最大似然估计方法获得的最佳惩罚参数。具体而言,图中相交于红色垂直线的三条回归线表示所选的三个最优放射组学特征。(C)RM在GBC和GBBL患者之间的区分性能。左:显示RM在区分GBC和GBBL患者方面的表现的ROC曲线,在测试子集中AUC为0.86。右:显示每个样本预测分布的混淆矩阵。AUC,曲线下面积。CI,置信区间。(D)在完整数据集中GBCseeker、RM和CBM之间ROC曲线的比较。AUC值使用Delong检验进行比较。(E)GBCseeker、RM和CBM的决策曲线分析结果。该图显示了针对所有参与者(全部治疗或不治疗)在完整数据集中的三种模型在不同风险阈值下的净收益(y轴)。不治疗曲线固定在净收益为0,而全部治疗曲线在代表恶性肿瘤患病率的数值处与y轴和不治疗曲线相交。(F)GBCseeker、RM和CBM在不同类型GBOLs(内GBOLs和壁GBOLs)之间的诊断性能比较。AUC值使用DeLong检验进行比较。∗p < 0.05;∗∗p < 0.01;∗∗∗∗p < 0.0001。另见图S6和S7以及表S3和S4。
Para_01


  • 最后,为了寻求一个具有临床评估和样本基因组特征的最佳模型,我们通过逻辑回归结合了CBM和RM来开发一个多模态分类器,称为GBCseeker。
  • 最终模型在训练集和测试集中的AUC最高(训练:0.98,95%置信区间:0.96-1.00;测试:0.97,95%置信区间:0.92-1.00)(图S7A和S7B)。
  • 为进一步验证GBCseeker在疾病诊断中的性能,我们使用了来自独立验证队列的98名GBOL的数据(表S4),其临床特征分布与发现队列相同。
  • GBCseeker表现出了一致的性能,在95%置信区间内AUC为0.93(95%置信区间:0.89-0.98;图S7C)。
  • 在内部和外部数据集中,该模型的诊断准确性均超过85%(发现:93.33%;外部验证:87.76%;表2),确认了其在GBOLs诊断中的可靠性和可重复性。
  • 在组合的发现和外部验证队列(n = 297)中,GBCseeker比单独的CBM和RM具有更强的能力来区分GBC和GBBLs(与CBM相比,p < 0.0001;与RM相比,p = 0.0289;图4D)。
Para_02


  • 为了评估这些模型的潜在临床实用性,我们应用了决策曲线分析(DCA)来确定它们在哪些有价值的阈值概率范围内表现出净临床效益,这是一个真实和虚假阳性加权组合,权重来自阈值概率。40 DCA显示,在完整数据集(n = 297,图4E)中几乎所有的阈值概率下,GBCseeker的净效益大于RM和CBM。我们的数据显示,GBCseeker可以作为预测GBOL患者恶性风险的准确临床工具。
  • The DCA revealed that the GBCseeker had a greater net benefit than the RM and the CBM across almost all threshold probabilities in the complete dataset (n = 297, Figure 4E).
Para_03


  • 增厚病变(GBC、XGC、GA 和 CAC)和腔内病变(GBC、GBP 和 GBA)是 GBOLs 的两种影像学表现。
  • 因此,我们评估了上述三种模型在这两种亚型中的诊断优势。
  • 在完全队列的腔内病变(in-GBOLs,n = 102)中,与 GBCseeker 类似,RM 的 AUC 高于 CBM。
  • 在增厚病变(wa-GBOLs,n = 137)中,GBCseeker 在三个模型中也表现出最高的 AUC 值(图 4F)。
  • 因此,RM 模型在腔内病变的诊断价值方面优于壁增厚,而 CBM 模型在壁增厚的诊断价值方面高于腔内病变。
  • GBCseeker 在这两种疾病中均表现出相似的高价值。
Consistency of clinical diagnosis with GBCseeker

临床诊断与GBCseeker的一致性
错误!!! cannot unpack non-iterable NoneType object



图片说明
◉ 图5。GBCseeker与外科医生预测价值的比较(A)完整数据集中外科医生和GBCseeker在不同AJCC分期检测GBC的敏感性比较。(B)可切除GBC和19个GBBLs测试子集中外科医生和GBCseeker之间ROC曲线的比较。AUC值使用DeLong检验进行比较。(C)各种模型在测试子集(26个可切除GBC和19个GBBLs)中与外科医生诊断结果相比的预测结果。星号"∗"代表被外科医生误诊而被GBCseeker正确诊断的患者;加号"†"代表被外科医生正确诊断但被GBCseeker误诊的患者。(D)左:完整数据集中外科医生和GBCseeker之间的诊断结果流程。右:不同诊断结果的比例矩阵。黄色单元格表示正确分类患者的比例,红色和蓝色单元格分别表示被错误诊断的GBBL和GBC患者。另见图S8。
Risk stratification of GBOLs with GBCseeker

使用GBCseeker对GBOLs进行风险分层
Para_01


  • 患有胆囊良性或恶性病变的患者需要接受手术,但采用不同的手术程序。
  • 通过 GBCseeker 改进对胆囊病变的诊断,鼓励我们探索该模型是否能为手术决策提供帮助。
  • 为此,我们定义了两个风险截断点(0.45 和 0.70),一个偏向高灵敏度,另一个偏向高特异性(详情见补充方法)40,将胆囊病变患者重新分类为三组:低风险(GBCseeker 评分 < 0.45)、中风险(GBCseeker 评分从 0.45 到 0.70)和高风险(GBCseeker 评分 > 0.70)。
  • 从 GBCseeker 获得的风险评分被用于辅助手术决策。
  • GBCseeker 评估为低风险的患者预计仅需进行简单的腹腔镜胆囊切除术,而不是根治性手术;相反,GBCseeker 评估为高风险的患者预计直接进行根治性手术。
  • 根据 GBCseeker 评估为中风险的患者将安排进行冰冻活检以协助手术期间的决策。
  • 我们进一步分析并比较了整个数据集(n = 297)和可切除亚组(n = 227,图 6A)中的分层效率。
  • 使用改良的三类 GBCseeker(mGBCseeker)进行决策,在识别良性病变人群方面达到了 91.75%(89/97)的准确性,仅有 8.25%(8/97)的胆囊良性病变被错误评估并过度治疗(图 6B)。
  • 在完整的队列中,168 名胆囊癌患者被正确归类到高风险组,23 名被标记为中风险以接受冰冻活检(图 6A)。
  • 上述 191 名患者(95.50%,191/200)最终接受了根治性手术,避免了二次手术的可能性(图 6B)。
  • 在可切除组中,使用 mGBCseeker 后,93.85% 的胆囊癌患者(122/130)将接受最佳手术方案(图 6B)。
  • 仅有 4.50% 的胆囊癌患者(占可切除胆囊癌患者的 6.15%)被误诊并进行了正常的胆囊切除术,增加了转移的风险(图 6B)。
  • 当使用从 GBCseeker 生成的风险评分时,诊断错误率进一步降低至 5.72%(可切除胆囊癌中的 7.04%,图 6C)。
  • 此外,仅有 10.77% 至 11.45% 的中风险胆囊病变患者在手术期间被指示需要进行冰冻活检(图 6D)。
  • 减少手术期间的活检比例可以缩短外科医生的等待时间并提高手术效率。
  • 这一发现表明,mGBCseeker 可以在各种临床场景中提高诊断准确性,即使对于早期阶段的胆囊癌也是如此。


图片说明 ◉ 图6。使用mGBCseeker对GBOL患者和可切除GBOL患者的危险分层(A-C)(A)完整队列中的GBOL患者(n = 297)和可切除亚组(n = 227)被重新分类为高风险、中风险和低风险组;(B)GBOL危险分层在完整队列(97名GBBL患者和200名GBC患者)和可切除队列(97名GBBL患者和130名GBC患者)中的潜在临床效果;(C)使用mGBCseeker后完整队列(n = 297)和可切除队列(n = 227)的诊断误差。(D)完整队列(n = 297)和可切除队列(n = 227)中需要冷冻活检的中等风险患者百分比。(E)使用改良GBCseeker(三类)的GBOL患者的临床决策流程。 ◉ ,
Para_01


  • 集体而言,mGBCseeker 使用了 14 个基因组变量、2 个临床特征和 CT 图像,作为提高胆囊癌和胆囊良性病变诊断的强大工具。
  • 在这里,我们展示了 mGBCseeker 用于外科医生的工作流程,可用于胆道肿瘤的临床诊断和管理(图 6E)。
  • 我们还开发了一个网站来实施 mGBCseeker(https://apps.hpc.sjtu.edu.cn/GBCseeker/prediction),以便公众访问并帮助进行手术分类。
Discussion

Para_01


  • GBC是最常见的胆道癌类型,预后较差。
  • 值得注意的是,虽然胆囊良性病变和胆囊癌(GBOLs)的发病率最近有所增加,但由于这两种疾病具有某些相似的临床症状,诊断错误的发生率并不低。
  • 最初被误诊为胆囊良性病变的胆囊癌患者往往错过了早期根治性手术的机会,从而发展成预后不良的恶性肿瘤。
  • 最近的一项研究表明,接受二次根治性切除手术的胆囊癌患者与直接开放根治性手术的患者相比,生存期显著缩短。
  • 因此,从高危人群中早期识别胆囊癌患者是一个重要的挑战。
  • 在这项研究中,我们建立了GBCseeker,这是一种基于机器学习的诊断模型,在区分内部和外部队列中的胆囊癌与其他胆囊良性病变方面表现出高敏感度(分别为92.68%和93.55%)和高特异性(分别为94.74%和77.78%)。
  • 此外,GBCseeker可以显著降低胆囊癌和胆囊良性病变的误诊率(从21.55%降至9.43%)。
  • 相应地,mGBCseeker将患者的误诊率降低到了5.72%。
Para_02


  • 鉴于其非侵入性和高检测灵敏度,来自外周血样本的cfDNA测序已成为一种有前景的疾病诊断方法,尤其是在癌症诊断方面。
  • 在过去两年中,基于cfDNA基因改变的机器学习模型已经证明了对高风险人群早期检测各种恶性肿瘤的巨大价值。
  • 然而,这种基于血液样本的基因组分析尚未广泛用于早期阶段的GBC患者,而这些患者在GBOLs患者中普遍存在误诊现象。
  • 为了开发一个可靠的机器学习模型,我们招募了来自11家医疗中心的203名各阶段GBC患者,并前瞻性地调查了他们的疾病基因特征。
  • 我们在本研究中建立的CBM在诊断GBC和GBBLs方面表现出色。
  • SHAP分析定性且图形化地评估了应用于我们的CBM的各种指标的不同水平。
  • 尽管我们的基因面板是从GBC组织中筛选出来的,但我们的研究中的一些良性病变也携带了与恶性病变相同的基因改变,包括KMT2D、PTCH1、TET2和PALB2基因突变,这些基因突变与GBC呈负相关。
  • 这一发现可能归因于良性病变作为癌前病变经历致癌突变的表达特性。
  • 因此,强烈建议通过胆囊切除术治疗这些病变。
Para_03


  • 放射影像学是筛查胆囊癌早期发病的最常见和必不可少的工具。
  • 由于胆囊息肉病变的图像特征不典型以及放射科医生解读的主观性,误诊率较高。
  • 基于影像组学的深度学习算法对于改善胆囊息肉病变分类具有显著潜力,研究报道这类技术的敏感性为82.4%-91.0%,特异性为92.5%-97.8%。
  • 然而,在这些研究中,影像组学模型是通过回顾性招募仅44-63名胆囊癌患者的资料构建的,并且没有进行外部验证。
  • 此外,这些模型是基于CT切片上手动标记的感兴趣区域构建的,这非常耗时。
  • 我们目前的前瞻性研究采用了更大的样本量,并实现了多个队列(来自11家医疗机构的297例病例)中的模型稳健性。
  • RM是通过全自动ROI分割结合分类过程开发的。
  • 外科医生只需导入DICOM格式的图像文件,就可以直接获取模型的诊断结果。
  • 此外,我们的自动化诊断模式达到了90.24%的敏感性和84.21%的特异性。
  • 因此,GBCseeker在大量患者群体和外部验证中展示了对胆囊息肉病变诊断的巨大价值和高可靠性。
Para_04


  • 我们模型的主要构建策略涉及基因组学和放射组学模型的结合,并使用了一种集成的机器学习方法。确实,目前在开发基于医学的人工智能模型过程中,多模态方法受到了特别关注。54
  • 借助人工智能算法的支持,整合多组学的信息和诊断优势,可以比单个模态更全面地反映疾病的特征,提供一种快速且统一的结局预测和疾病诊断方法。
  • 已经发表了几种用于诊断肺结节的多组学平台,并显示出相当大的潜力。40,41,55
  • 我们的研究是一种多分析方法,用于识别GBOLs(疑似胆囊癌病变)。通过表征cfDNA特征,我们旨在建立一种非侵入性的GBC检测模型,该模型可以为影像学发现和肿瘤标志物提供有用的辅助,而不是取代传统的诊断指标。
  • 除了科学可靠性外,理想的癌症筛查方法还应该具有可行性和经济性。
  • 我们的GBCseeker检测仅需一周内对13个候选基因进行靶向外显子测序,成本低于100美元。
  • 在获得遗传测试的初步结果后,鼓励外科医生使用我们的GBCseeker网站生成GBBC的风险评估档案。
  • 为了避免患者过度检查,此检测设计用于由放射学筛选出的占位性病变个体,以实现精准诊断,而患有单纯胆结石或胆囊炎的患者不建议使用此测试。
Limitations of the study

研究的局限性
Para_05


  • 尽管 GBCseeker 是用于从良性 GBOL 中筛选 GBC 的最佳模型,但这项研究中仍有一些局限性需要注意。
  • 首先,我们的数据集对于一个稳健的人工智能模型来说相对较小。
  • 我们已经联系了几个来自其他国家发表 GBC cfDNA 特征的团队。
  • 然而他们的液体活检队列没有相应的放射学信息。
  • 我们目前正在计划扩展一个基于 cfDNA 液体活检和 CT 扫描的真实世界研究,以更新模型,并结合更多的国外癌症中心,包括一些当地医院。
  • 其次,我们的模型仅由一个维度构建,即 cfDNA 突变。
  • 血浆中可以观察到的其他遗传改变,如 DNA 甲基化和片段化,对于识别癌症也很重要。
  • 最后,也可以整合一种基于代谢组学的模型,以提供更多关于疾病分类的代谢见解。
  • 最近,据报道一种代谢模型能够以 94.74% 的敏感性和 87.23% 的特异性对 GBC 进行分类。
Para_06


  • 总的来说,我们揭示了胆囊癌和胆囊良性病变患者的cfDNA突变图谱,并开发了一种预测模型CBM,利用这些基因组改变来检测胆囊癌。
  • 我们还通过自动化分割和分类开发了一个修改后的放射组学模型RM,并将其与CBM结合成GBCseeker。
  • 这种多分析方法依赖于个性化的、靶向的NGS和自动提取的图像特征,在临床实践中具有很大的潜力,可用于辅助诊断胆囊癌,并随后优化手术策略。
Resource availability

Lead contact

主要联系人
Para_01


  • 进一步的信息和资源请求应联系首席联络人 Yingbin Liu (laoniulyb@shsmu.edu.cn),并将由其满足。
  • ,
Materials availability

材料可用性
Para_01


  • 本研究没有产生新的独特试剂。
Data and code availability

数据和代码可用性


  • 原始测序数据FASTQ文件已提交至NGDC GSA-Human数据库(中国国家生物信息中心/北京基因组研究所,中国科学院的国家基因组数据中心)并获得访问编号:HRA010367,数据可在https://ngdc.cncb.ac.cn/gsa-human 公开获取。
  • 所有原始代码已存放在 Github 上,并在发表日期起公开可用。详细网址列在关键资源表中。
  • 重新分析本文报道的数据所需的任何附加信息,请联系主要作者索取。
Acknowledgments

Para_01


  • 我们要感谢所有参与本研究的患者。
  • 我们要感谢华盛顿大学的柴远浩提供的技术支持。
  • 我们也感谢上海交通大学网络信息中心的工作人员,尤其是李瑞、张占兵、王星泽和张亦方所提供的技术支持。
  • 我们要感谢生物样本团队,特别是岳竹影在样本管理方面的帮助。
  • 我们要感谢放射科团队,特别是李建英和吴倩云在CT影像注释方面的工作。
  • 我们还要感谢上海交通大学医学院邵荣教授在手稿编辑方面的帮助,以及周宁宁在插图制作方面的贡献。
  • 我们也非常感谢来自韩国CHA Bundang医疗中心的研究人员,尤其是全洪在教授慷慨分享cfDNA测序数据的帮助。
Para_02


  • 这项研究得到了中国国家自然科学基金(编号:32130036)的支持。
  • 同时得到了国家转化医学中心(上海)开放项目的支持(编号:NRCTM(SH)-2021-04)。
  • 此外还得到了上海申康医院发展中心临床技术创新项目的资助(编号:SHDC12021101)。
  • 该项目也获得了上海市科学技术委员会基础研究项目的资助(编号:23DZ2202800)。
  • 并且得到了上海市科学技术委员会重点项目的资助(YDZX20193100004049)。
  • 该项目还获得了上海市启明星计划的支持(23QA1408500)。
  • 同时得到了上海市卫生健康委员会青年人才项目的资助(2022YQ061)。
  • 此外还获得了上海市卫生健康委员会的资助(202140050)。
  • 该项目还得到了上海交通大学星医疗工程交叉基金的支持(YG2022ZD006)。
  • 最后,该项目得到了上海癌症研究所和上海润达融玛生物科技有限公司基础研究项目的资助(SYXF0120022383)。
Author contributions

Para_01


  • 概念和设计,M.Y.,翁小玲,刘发涛,刘云,和刘英斌;资金获取,刘英斌,刘云,刘发涛;项目管理,X.L.,刘云,和刘英斌;监督,龚伟和刘英斌;提供研究材料或患者,Z.L.,M.H.,L.Y.,H.W.,C.T.,J.Z.,W.C.,W.W.,李茂兰,J.H.,Z.Z.,H.S.,刘福宝,B.W.,H.H.,F.F.,X.J.,H.L.,吴翔,G.L.,张浩,T.Z.,臧红,李明,和江刚;数据收集与组装,M.Y.,赵洋,L.C.,翁霞,郭巍,W.J.,T.W.;数据分析与解释,M.Y.,赵洋,L.C.,Z.L.,郭巍,刘发涛,Z.W.,G.Y.,周洋;手稿撰写,所有作者;手稿最终批准,所有作者;对作品所有方面负责,所有作者。
  • ,
Declaration of interests

Para_01


  • 作者声明不存在竞争性利益。
STAR★Methods

Key resources table

关键资源表
Experimental model and study participant details

实验模型和研究参与者详情
Patient enrollment

患者招募
Para_01


  • 参与这项前瞻性研究的患者主要通过多家中心的放射影像诊断。
  • 所有患者在审查了涉及医院的伦理委员会批准的协议后提供了知情同意(参见表S5中的列表)。
  • 随后,这些患者被允许参加血液样本采集和分析。
  • 在初始登记过程中获得了患者的特征信息,包括人口统计学资料、CT图像、检查结果和治疗史。
Patient inclusion and exclusion criteria

患者纳入和排除标准
Inclusion criteria


  • 具有放射学确认的胆囊占位性病变,并高度怀疑胆囊癌。
  • 至少有一个根据RECIST(第1.1版)标准可测量的病灶(CT上目标病变的最大直径≥10毫米)。或者胆囊壁局限性或弥漫性增厚大于10毫米。
  • 计划接受手术治疗或组织活检以获得明确的病理结果。
  • 签署书面知情同意书。(如参与者无法阅读或签字,则由法定代表人签署知情同意书。对于无法表达同意的参与者,应将其法定代表人告知上述介绍和解释,并由其法定代表人签署知情同意书)。
  • 年龄:18至85岁。
  • 保持生命体征稳定,并且东部肿瘤合作组织(ECOG)体能状态评分为≤1。
  • 重要器官包括骨髓、肾脏和肝脏功能健全:白细胞计数>3000/μL,中性粒细胞绝对计数>1500/μL,血小板计数>75000/μL,血红蛋白≥9 g/dL,总胆红素≤3.0×机构正常上限(ULN),天冬氨酸转氨酶(AST)/丙氨酸转氨酶(ALT)水平≤5×机构ULN,肌酐清除率≥30 mL/min。
  • 同意在研究期间以及在此之前,育龄妇女和男性应采取适当的避孕措施。
Exclusion criteria


  • 没有病理诊断结果。
  • 肿瘤的主要关注点不是胆囊。
  • 在入组前接受过靶向治疗或化疗。在本研究前接受过放疗但未进展。
  • 参加其他治疗/干预性临床试验。
  • 在注册前至少5年内没有其他癌症的无疾病生存期,除了已治愈的宫颈原位癌和非黑色素瘤皮肤癌。
  • 存在无法控制的并发疾病,包括但不限于:无法控制的充血性心力衰竭(纽约心脏协会(NYHA)分级≥3级),不稳定型心绞痛,无法控制的心律失常,无法控制的高血压(定义为尽管接受了最佳药物治疗,收缩压仍大于160毫米汞柱或舒张压大于100毫米汞柱)。
  • 正在进行或活跃的感染。
  • 患有不受控制的糖尿病。
  • 患有需要长期使用激素的活动性自身免疫系统疾病。
  • 是否有器官移植的历史。
  • 经历物质滥用、医疗、心理或社会状况,这些可能干扰患者理解知情同意以及参与研究或研究结果评估的能力。
  • 保留任何不适合研究的严重疾病或医疗状况。
Sample size calculation

样本量计算
Para_01


  • 队列规模是使用PASS(版本15.0.5)确定的,该软件设计用于二分类检验中的样本量计算,并且在临床试验中常用。基于在0.05的p值α水平和70%的患病率下进行的计算,总样本量为137(其中包括96名患有GBC的受试者),能够使用双侧二项检验以87%的把握度检测到灵敏度从0.9变化到0.98,以及以85%的把握度检测到特异性从0.8变化到0.92。
Method details

方法细节
Sample collection

样本收集
Para_01


  • 最初,至少收集了10毫升外周血到标有cfDNA血液收集(CWBIO)的试管中,在室温下保存。
  • 所有的血液样本都在1500×g和随后的15000×g下离心10分钟,以便在采集后72小时内将血浆从上清液中分离出来。
  • 血浆和剩余的血液样本都被储存在生物银行中,温度为-80℃,直到需要进行DNA提取。
DNA extraction and library preparation

DNA提取和文库准备
Para_01


  • 循环cfDNA使用HiPure Circulating DNA Midi Kit A(Magen)从2 mL血浆中提取,按照制造商的说明进行操作。
  • 基因组DNA(gDNA)使用QIAamp DNA Mini Kit(Qiagen)从肿瘤组织和血液样本中提取。
  • 随后使用Qubit dsDNA HS Assay Kit(Invitrogen)测量不同样品中的DNA浓度,并记录下来。
Para_02


  • 文库使用Hom Lib Prep Kit for Illumina(Homgen)构建。简而言之,从每个样本中提取的所有cfDNA都经过了末端修复、加多聚A尾和双链cfDNA片段两端带有独特分子标识符(UMI)接头的连接。
  • 总之,所有从每个样本中提取的cfDNA都经历了末端修复、加多聚A尾以及在双链cfDNA片段两端连接带有独特分子标识符(UMI)的接头过程。
Sequencing probe construction and targeted deep sequencing

测序探针构建和靶向深度测序
Para_01


  • 所有的文库都用以前描述的自设计探针与Illumina的TruSeq文库试剂盒杂交(Homgen)。
  • 捕获探针由四部分组成,以提高cfDNA的检测灵敏度:(1) 肿瘤相关药物基因;
  • (2) 与同源重组缺陷(HRD)相关的基因,包括BRCA1/BRCA2和ATM;
  • (3) 包括MSK-IMPACT和Foundation在内的OncoKB数据库(https://www.oncokb.org/cancerGenes)中的肿瘤相关基因,主要包含来自7个数据库的肿瘤相关基因;
  • (4) ERBB家族基因和其他参与ErbB信号传导的基因,包括EGFR、ERBB2、ERBB3和ERBB4。
  • 最后一部分是根据我们团队发表的全外显子测序(WES)数据构建的,针对GBC中最常突变的基因。
  • 总的来说,探针覆盖了1.21 Mbp的基因组。
  • 所有包含的基因如表S1所示。
  • 采用Illumina HiSeq 2500仪器进行了双端测序。
Bioinformatics processing

生物信息学处理
Para_01


  • 所有生物信息学数据处理均在上海交通大学思源平台完成。
  • 来自cfDNA和WBC gDNA的原始FASTQ格式读段使用Burrows-Wheeler对齐器(BWA,版本0.7.17-r1188)与参考人类基因组19(hg19)对齐。
  • 带有或不带有UMI的映射读段的排序、过滤和索引使用Sentieon工具(版本20211206)进行。
  • 使用Sentieon软件中的TNscope识别单核苷酸变异(SNV)和小插入/缺失(INDEL)。
  • 变异调用后,使用ANNOVAR对SNV和INDEL进行了功能注释。
  • 为了识别高置信度的突变,设置了以下附加过滤程序:(1)在全血gDNA和cfDNA中等位基因频率超过20%的种系突变;(2)同义变异;(3)在单核苷酸多态性数据库(ClinVar,https://www.ncbi.nlm.nih.gov/clinvar/;ExAC,http://exac.broadinstitute.org/;和dbSNP,https://www.ncbi.nlm.nih.gov/projects/SNP/)中频率超过1%的变异。
cfDNA-based model (CBM) construction

基于cfDNA的模型构建
Para_01


  • 最初,基因表达数据通过使用RobustScaler进行归一化处理,以确保样本之间的可比性。
  • 采用了分层5折交叉验证,以保持每折内类别分布的完整性,从而增强特征选择过程的稳健性和泛化能力。
  • 从111个基因中选择突变特征是在训练集中根据一种系统算法进行的,该算法结合了随机森林(RF)算法和递归特征消除(RFE),并通过交叉验证技术加以增强。
  • 在每次折叠中,执行RFE以识别指定数量的特征(10、15或30),并训练一个RF分类器。
  • 通过这一迭代过程选出的特征随后根据来自RF分类器的‘重要性’函数生成的重要性进行排名。
  • 我们使用袋外错误率来衡量特征的重要性。
  • 完成交叉验证迭代后,特征重要性得分在各折之间取平均值作为"重要指数",从而基于其累积重要性对基因进行综合排名。
  • 最终,根据重要性得分选择了前30个基因组特征。
  • 这一全面的方法确保所选特征不仅具有统计学意义,而且在肿瘤病理学背景下也具有生物学相关性。
Para_02


  • GBOL分类器的开发包括两个步骤:(1)基于仅存在于GBC样本中且可以在cfDNA中检测到的高度普遍的体细胞突变的初始模型;(2)基于选定的遗传改变和具有差异潜力的临床特征的集成模型。
  • 为了提高模型的可靠性和准确性,我们通过整合基础模型的预测结果建立了一个集成机器学习管道。
  • 在二元分类中常用的算法中,我们测试了总共六种候选机器学习算法,包括随机森林(RF)、逻辑回归(LR)、朴素贝叶斯(NB)、支持向量机(SVM)、K近邻(KNN)和XGBoost(XGB)。
  • 最终,由于这四种算法在训练集中的表现相对较好,选择了RF、LR、SVM和XGB。
  • 然后,将这四种算法的预测概率作为输入,用于StackingClassifier框架内的广义线性模型(GLM)。
  • 最终模型由选定的基于cfDNA的特征与具有最佳算法的临床特征组合构建。
  • 独立的内部测试子集和外部验证数据集在模型构建过程中保持完整,用于评估最终模型的性能。
  • 整个模型构建过程是在Python(版本3.10.2)中使用scikit-learn(版本1.2.0)完成的。
Radiomic model (RM) construction

影像组学模型(RM)构建
Para_01


  • 术前多模式CT图像从入选参与者中获取,包括非增强、动脉期、静脉期和延迟期图像。由于一些患者最初未进行增强成像,因此分析中也包含了非增强CT。
  • RM 包括两部分:1)分割过程和 2)分类过程。
Para_02


  • 首先,在发现队列的训练集中手动分割了胆囊和病变,以便后续训练自动分割网络。
  • ROI由来自两家医疗机构的新组建的放射科团队划定,团队成员对患者的病理结果和临床数据不知情。
  • 两名分别有4年和8年经验的年轻放射科医生阅读了图像并绘制了感兴趣区域,之后由拥有23年经验的YZ进行了结果审查。
  • GC Y,一位有超过31年经验的资深放射科医生,重新检查了结果进行最终确认。
  • 整个放射科团队对组织病理学结果和临床数据进行了屏蔽。
  • ROI包括胆囊、疑似病变以及胆结石(如果存在)。
Para_03


  • 我们采用了nnU-Net架构作为自动化GBOL分割框架的主干。
  • 分割过程遵循级联方法,首先使用粗略模型定位目标,然后使用精细模型准确描绘目标边缘。
  • 三维网络编码器包含五个下采样模块和六个卷积模块,而解码器包含五个上采样模块和六个卷积模块。
  • 粗略模型和精细模型的输入块尺寸均设置为[128, 128, 128],相应的间距值分别设置为[5, 5, 5]毫米和[0.8, 0.8, 0.8]毫米。
  • 由网络生成的最终分割掩膜涵盖了胆囊和肿瘤目标。
Para_04


  • 鉴于切片厚度和间隔对特征重现性有显著影响,从使用LIFEx勾画的最大横截面积层面上的ROI中提取了74个放射学特征。
  • 在生成三维图像后,基于病变在x-y平面上的几何形状确定了z方向上横截面积最大的平面。
  • 随后,采用最小绝对收缩和选择算子(LASSO)分类器根据其对分类任务的贡献来选择最相关的预测特征。
  • 在特征选择之后,使用Bootstrap森林方法在训练队列中构建了基于放射学的预测GBC模型。
  • 为了减轻样本偏差,进行了5折交叉验证以进行模型验证。
  • 放射学特征选择和建模是在JMP软件(版本17pro;SAS Institute)中进行的。
Para_05


  • 在模型构建之后,我们还优化了自动分割程序,以便我们可以直接从感兴趣区域(ROI)中提取用于分类的最具显著性的放射学特征。
GBCseeker development

GBCseeker开发


  • x = −6.91887074 + 5.69670492 × 基因评分 + 6.03061365 × 影像组学评分
Para_01


  • 基因组评分是由CBM生成的风险评分,而放射组评分是由RM生成的风险评分。
  • ,
Risk reclassification criteria

风险重新分类标准
Para_01


  • 根据ROC曲线分析在全部队列(n=297)中的GBCseeker评分生成了两个截止值(0.45和0.70)。
  • "0.45"对于胆囊癌筛查具有高灵敏度(灵敏度为0.95,特异性为0.82,截止值为0.45),
  • 另一个则更侧重于高特异性(特异性为0.92,灵敏度为0.84,截止值为0.70)用于排除胆囊癌。
Quantification and statistical analysis

量化和统计分析
Para_01


  • 临床记录中一小部分患者(≤7.9%)在初始登记时的不完整条目通过多重插补使用MICE包(版本3.15.0)进行了替换。
  • 连续变量以中位数和四分位间距表示,曼‒惠特尼U检验用于两组之间的比较。
  • 比例构成比用于描述分类数据,费舍尔精确检验用于两个类别之间的比较。
  • 通过Spearman分析评估了两个数据集之间的相关性,对于分类数据使用Pearson分析来评估连续数据的相关性。
Para_02


  • 诊断模型的价值通过使用pROC包(版本1.17.0.1)62生成的受试者工作特性(ROC)曲线分析进行了评估。根据从约登指数得出的曲线的最佳截止值,还计算了敏感性(Se)、特异性(Sp)、阳性预测值和阴性预测值(PPV/NPV)、准确性和F1分数以及相应的95%置信区间。
  • 通过rmda包(版本1.6)进行的决策曲线分析评估了模型的临床效用,该分析量化了不同阈值概率下参与者的净收益。
  • SHAP方法广泛用于机器学习环境中,用于解释不同预测因子的重要性。
  • dice系数(DC)值被用来评估CT图像的分割性能。
  • DC值计算如下:Dice系数=2|A∩B|/(|A|+|B|)
  • 其中A是预测像素集,B是真实像素集。
  • 患者的整个切片的DC值被计算为每个标签的DC值的加权平均值,权重由数据集中每个标签的比例确定。
Para_03


  • 所有的统计分析和绘图都是通过 GraphPad Prism(版本 10.2.3)和 R(版本 4.2.2)完成的。
  • 双侧检验,p 值小于 0.05 被认为具有统计学意义。
Additional resources

额外资源
Para_01


  • 临床试验编号:ChicCTR2100049249 和 NCT04183712。
Supplemental information

Para_01


  • 下载:下载 Acrobat PDF 文件(838KB)文档 S1。图 S1–S8 和表 S1、S2、S4 和 S5。
  • 下载:下载电子表格(92KB)表 S3。从 GBOLs 的 ROI 提取的 219 个放射组学特征,与图 4 相关。
  • 下载:下载 Acrobat PDF 文件(7MB)文档 S2。文章加补充信息。
回复 支持 反对

使用道具 举报

发表于 2025-3-19 16:12 | 显示全部楼层
液体活检技术,特别是cfDNA分析,在癌症的早期发现和病情跟踪监测领域已经积累了丰富的研究成果。研究者们开发出了多种肿瘤标志物,包括单核苷酸变异(SNV)、拷贝数变异、甲基化模式、片段化模式以及核小体足迹等。虽然cfRNA的稳定性相对较差,但由于其高丰度和灵敏性,它与癌症患者的生理变化密切相关,因此在临床上具有广泛的应用价值,并且成为了近年来研究的热点。
在2023年12月举行的第五届癌症代谢与治疗国际学术研讨会上,《早期胰腺癌分子诊断专家共识(2023 武汉)》被正式发布。该共识推荐将miRNA作为早期胰腺癌辅助诊断的一种手段,这一提议也象征着cfRNA生物标志物应用的成熟阶段已经到来。









回复 支持 反对

使用道具 举报

发表于 2025-3-19 16:13 | 显示全部楼层
目前缺乏有效评估肠癌MRD(minimal/measurable residual disease,微小/可测量残留病灶)水平的有效生物标物。根据2021 v2 NCCN指南,血液ctDNA被推荐用于“可切除结直肠癌的辅助化疗”患者MRD监测,希望能够提供预后信息,帮助II-III期肠癌患者的辅助化疗。此外,术后ctDNA也被认为是能够监测肠癌患者复发风险的标志物。


▲ ctDNA监测在肠癌中的应用场景

目前,大量的文章均证实,利用ctDNA进行肠癌MRD监测具有更高的灵敏度和特异性。根据马萨诸塞州总医院(MGH)的最新报道,他们开发出一种结合基因组和表观基因组癌症特征的纯血浆ctDNA分析方法以实现肿瘤MRD监测,相关的研究成果发表在《Clinical Cancer Research》。



背景
肠癌是全球发生率排名第三,癌症相关死亡第二的恶性肿瘤。对于较为早期肠癌患者,仅需要通过手术治疗,其中包含的部分高风险患者,术后需要辅助化疗延长患者生存。然而,除了根据肿瘤分期、临床标准和癌胚抗原(CEA)等进行危险分层外,目前还没有有效的临床工具来识别术后MRD。因此,利用更为敏感的指标来筛选出MRD阴性(低风险)患者,能够避免潜在的治疗毒性。
本研究中,研究人员开发了一种通过整合基因组和表观遗传学相关的癌症特征,可以在不依赖于肿瘤组织检测的情况下对肿瘤进行跟踪。因此,利用这种ctDNA检测技术能够提高临床应用。


▲ 研究分析流程

研究结果
研究共纳入103例接受根治性手术的肠癌患者,其中 84例患者(包括接受手术后和辅助化疗完成的患者)在接受治疗后具有可评估的范围。研究结果显示,15例ctDNA阳性的患者最终都出现了复发;49 例ctDNA为阴性的患者,最终有12例出现了复发,敏感度与特异性分别达到55.6%和100%。


▲ ctDNA预测患者复发风险评估

此外,一项纳入2010例样本的研究数据证实ctDNA可作为预测III期肠癌预后有效标记物。



研究共纳入2010例患者,1017例患者被用于ctDNA分析,其中877例为ctDNA阴性,140例为ctDNA阳性患者,所有患者的中位随访时间为6.6年。


▲ 研究分析流程

研究结果显示,140例ctDNA阳性患者的3年无病生存(DFS)率为66.39%;877例ctDNA阴性患者的3年DFS率为76.71%(p = 0.015)。
研究证实ctDNA能够做预测患者DFS(HR 1.55,95% CI 1.13-2.12,p = 0.006)和总生存期OS(HR 1.65,95% CI 1.12-2.43,p = 0.011)独立的预后分子。




▲ DFS及OS分析

总结
ctDNA作为早期肠癌患者术后MRD监测,能够更加精确地预测患者复发,为早期肠癌患者提供临床获益。同时,对于中晚期肠癌患者,ctDNA能够预测患者的OS及DFS,这为临床医生制定治疗方案提供了有力的证据。

参考文献:
1. Grothey A, Sobrero AF, Shields AF, Yoshino T, Paul J, Taieb J, et al. Duration of adjuvant chemotherapy for stage III colon cancer. N Engl J Med 2018;378: 1177–88.
2. Tie J, Wang Y, Tomasetti C, Li L, Springer S, Kinde I, et al. Circulating tumor DNA analysis detects minimal residual disease and predicts recurrence in patients with stage II colon cancer. Sci Transl Med 2016;8:346ra92.
3. Tie J, Cohen JD, Lo SN, Wang Y, Li L, Christie M, et al. Prognostic significance of postsurgery circulating tumor DNA in nonmetastatic colorectal cancer: Indi- vidual patient pooled analysis of three cohort studies. Int J Cancer 2021;148: 1014–6.
4. Boeckx N, Op de Beeck K, Beyens M, Deschoolmeester V, Hermans C, De Clercq P, et al. Mutation and methylation analysis of circulating tumor DNA can be used for follow-up of metastatic colorectal cancer patients. Clin Colorectal Cancer 2018;17:e369–79.
5. Sorber L, Zwaenepoel K, Deschoolmeester V, Roeyen G, Lardon F, Rolfo C, et al. A Comparison of cell-free DNA isolation kits: isolation and quantification of cell-free DNA in plasma. J Mol Diagn 2017;19:162–16.
6. Almazi JG, Pockney P, Gedye C, Smith ND, Hondermarck H, Verrills NM, et al. Cell-free DNA blood collection tubes are appropriate for clinical proteomics: a demonstration in colorectal cancer. Proteomics Clin Appl 2018;12:e1700121.

声明:本资料中涉及的信息仅供参考,请遵从医生或其他医疗卫生专业人士的意见或指导。
回复 支持 反对

使用道具 举报

发表于 2025-3-19 16:14 | 显示全部楼层
癌症,已成为现代社会日益关注的新焦点。人口老龄化、生活方式以及环境等多种因素正推动癌症高发。根据世界卫生组织的数据,全球范围内1/6的人口死亡源自癌症,大约有1/2的人会在整个生命周期中引发各种各样的癌症。癌细胞是基因发生突变的细胞;为了研究每种癌症的机理并确定最合适的诊疗方法,这些癌细胞都需要进行分析研究。
据麦姆斯咨询介绍,传统的活检方法,需要通过侵入性手术获取肿瘤的部分组织。然而,这些方法成本高昂,且对于患者来说非常痛苦,因而无法进行定期常规操作,以监测肿瘤发展,提高长期的诊疗效果。现在,“液体活检”技术的出现,使我们得以摒弃过去的侵入性分析方法。
事实上,只需要收集病人的少量血液,其中相关的生物标记物便能够提供关于患者癌症状况的有用信息。很多公司正在开发相关技术,以收集、分离和分析扩散到血液系统中的循环肿瘤DNA(ctDNA)和循环肿瘤细胞(CTC)。




液体活检可以分析循环肿瘤细胞、循环肿瘤DNA和细胞外囊泡
得益于这些新方法,不仅能够非侵入性地诊断癌症,还可以了解每位患者的分子机理,选择并开发定制化的治疗方法,监测治疗效果(以及耐药性),以及针对疾病复发进行筛查。有些公司甚至还在研究癌症的早期筛查,尽管这是更加长期的一类应用。
因此,液体活检有潜力应用于癌症治疗的各个阶段,挽救更多生命,并降低医疗成本。其市场潜力巨大,相关市场已经很大,并正飞速的增长。根据本研究报告内容,液体活检市场规模将从2017年的17亿美元增长至2023年的78亿美元,2017~2023年期间的复合年增长率可达29%。这包括了硬件(系统和设备)和试剂的销售,以及CTC和ctDNA应用的相关服务营收。




改变癌症诊疗规则的液体活检
百家争鸣的厂商和商业模式
研究肿瘤细胞DNA的变异情况并不容易,需要很多不同的设备和技术。从生物标记物的富集和分析,到突变谱的生物信息学分析,这条产业链很长,涉及的厂商很多。本报告明确了产业链各个层级的所有厂商,明晰了每一环的佼佼者,并详细介绍了它们的市场价值点,以及液体活检技术的发展是如何引爆下游分析设备市场的,如测序和数字PCR等。本报告还介绍了ctDNA和CTC的差异和互补性,Yole分析师解释了为什么CTC还没有开始大量吸引投资,此外,得益于近期的技术发展,这一状况将会如何改变。
事实上,ctDNA厂商自2010年以来已经吸引了超过37亿美元投资,而CTC厂商则仅融资2.8亿美元。在营收方面,ctDNA厂商也同样占据了显著的优势。这主要源自商业模式的差异:大多数ctDNA厂商在它们自己的CLIA(美国临床实验室改进修正案)实验室,利用自己开发的方法进行测试,无需FDA(美国食品药品监督局)的核准。此外,ctDNA的另一个优势,是DNA相比活体细胞更容易存储和运输。相比之下,大部分CTC厂商则开发直接销售给终端用户的仪器设备及耗材。
然而,这些CTC分离应用的大部分仪器仍仅用于研究阶段,因为FDA在核准它们的临床应用前,仍需要更多的证据从患者的存活率来证明CTC分析的优势。这就至少部分解释了,为什么CTC厂商在营收方面会落后于ctDNA厂商。幸运的是,得益于近期的技术发展,以及越来越多的文献证明了CTC分析的价值(事实上,完整的活体细胞比DNA序列携带了更多的信息),这种情况或将很快有所改观。




2017年液体活检市场生态系统
微流控技术推动技术突破
得益于微流控技术的发展,液体活检工作流程中的多个步骤得以实现。从分离到下游分析,微流控器件无处不在。CTC富集和分离系统的一个重要部分就依赖于将CTC从其它血细胞中分离的微流控器件。这些微流控器件利用了细胞的物理性质,例如尺寸、形状、可变形性和介电性质等。
Angle plc、Celsee、Clearbridge Biomedics以及Vortex Biosciences等重要厂商都依赖微流控技术。这些微流控方案可用于广泛的细胞,实现低成本、高通量捕获。此外,下游分析解决方案在许多情况下也需要依赖微流控技术:Illumina、Ion Torrent等公司的DNA测序仪使用了微流控来流动细胞,其他如Bio-Rad、Stilla Technologies和RainDance(已由Bio-Rad收购)的液滴数字PCR等技术也采用了微流控技术。
所有这些最先进的技术都需要依赖创新的微流控硬件,实现了更复杂的分析功能,从而为癌症诊疗带来了实际改善。在本报告中,Yole重点关注了液体活检工作流各个阶段的微流控技术。


回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表