近日,国家级研究中心的癌症早期检测研究在线发表于Nature Communications(影响因子:16.6),臻和科技自主研发的多癌种早筛早检液体活检技术THEMIS®(THorough Epigenetic Marker Integration Solution)为该研究的核心技术平台。该研究由中国医学科学院肿瘤医院团队牵头完成,臻和科技核心参与并提供了创新的检测与分析方法,展示了基于外周血cfDNA全甲基化组测序的多维度分析在中国七大高发癌种(肺癌、结直肠癌、胃癌、肝癌、乳腺癌、食管癌、胰腺癌)早检中的高敏感度、特异性和组织溯源准确性。 癌症的早期发现和治疗有助于改善治疗效果,提高患者生存率,具有重大的临床价值和社会意义。外周血循环游离DNA(cell-free DNA,cfDNA)中包含肿瘤细胞脱落的DNA碎片(circulating tumor DNA,ctDNA),其携带的原始肿瘤细胞信息为无创液体活检提供了可能,有望通过一管血实现对多个癌种的同时检测及癌症信号的组织溯源。早期癌症患者血液中的ctDNA含量很低,若能整合多种癌症特征进行检测,可以更加灵敏地识别微弱的癌症信号。目前,基于cfDNA的甲基化和片段化特征进行癌症早检是两大主流技术路线,但是传统的甲基化建库技术利用重亚硫酸盐进行胞嘧啶的转化,该反应严重损伤DNA分子,会降低文库产量且不能用于片段特征的分析。 为解决这一技术难题,臻和THEMIS®平台创新性的探索了基于温和的酶转化法进行cfDNA全甲基化组测序(Whole-Methylome Sequencing, WMS)文库构建,从而最大程度的保护DNA分子的完整性以实现一份文库同时进行甲基化(MFR)、片段长度(FSI)、拷贝数变异(CAFF)和片段末端基序(FEM)等多种维度的分析(图1)。基于大规模多中心临床样本数据进行开发和验证,结合独特的生物标志物提取及整合算法,THEMIS®平台展现出优异的检测性能和模型稳定性。 图1. Overview of THEMIS® approach for cancer detection. 主要研究结果 研究设计 本研究入组来自六所医院的共计780例治疗前癌症患者和497例健康人对照的血浆样本,按照7:3的比例随机划分为训练集和独立测试集。模型开发完全基于训练集样本,并在测试集样本中衡量模型性能。 研究全甲基化组测序(WMS)适用于片段化特征和拷贝数变异分析设计 利用512例平行血浆样本对WMS和“金标准”全基因组测序(WGS)平台进行技术比较,发现血浆的拷贝数变异(CNA;相关系数:0.988)和片段化特征(FSI;相关系数:0.961)在两个平台高度一致(图2),证明WMS平台可适用于拷贝数和片段组学等维度的分析。 图2. Concordance between WMS and WGS in cfDNA copy number and fragmentation profiling. 多维度整合分析优于单一维度分析 通过对cfDNA的四种维度特征进行t-SNE数据降维,发现各维度特征对癌症血浆样本和健康人对照均具备一定的区分效果(图3a)。为增强检测灵敏度,首先对单个维度在训练集样本中构建机器学习模型,继而对各单维度的预测结果通过ensemble方法进行整合构建最终的癌症预测分类器(THEMIS®)。在ROC曲线分析中,THEMIS模型的AUC(训练集:0.972,测试集:0.966)高于各单维度,且在训练集和验证集中保持一致,证明模型的良好泛化性(图3b)。 图3. Cancer detection by multimodal analysis of cfDNA WMS data. 一流的敏感度和特异性 在针对各癌种的ROC曲线分析中,THEMIS®模型对所有癌种均展现出良好的AUC性能,且在训练集和测试集之间保持一致,证明模型的良好泛化性(图4a)。 不同于传统的单癌种筛查,多癌种早检需要对下游诊断路径提供指导,因此需要注重高特异性以降低假阳性率,避免将健康个体错误诊断为阳性导至不必要的后续检查和患者心理负担。本研究以99%特异性为cutoff值,来评估THEMIS®模型对各癌种和分期的检测性能(图4b)。经过训练集锁定模型后,THEMIS®模型在独立测试集中表现出83%的综合灵敏度,且灵敏度随癌症分期的上升而增加。对于ctDNA丰度低的Ⅰ/Ⅱ期样本,THEMIS®模型在测试集中的灵敏度达到73%。该性能与当前国内外已发表的多癌种早检研究数据相当或更优。 图4. THEMIS performance for multicancer detection. 良好的组织溯源能力 癌症信号的组织溯源(Cancer Signal Origin,CSO) 是多癌种早检的重要部分,可为下游诊疗路径提供指导。该研究创新性地探索了利用癌种特异的染色质可及区域的表观遗传状态进行组织溯源,合并相似器官后,测试集CSO的预测准确率为65%(图5)。未来通过积累更丰富的组织甲基化和染色质可及性研究数据,有望进一步提升CSO的准确性。 图5. Classification of cancer signal origin. 总结 该研究首次展示了利用酶转化法对血浆cfDNA同时进行甲基化、片段化、拷贝数变异等多维度特征分析的可行性。基于THEMIS®技术开发的多癌种早检产品臻预®,仅需10mL外周血即可实现对七大常见癌种的高检测灵敏度和特异性,具有广阔的应用前景。 作为无锡本土企业,臻和科技连续承接当地肿瘤筛查工作,包括协助无锡肿瘤全链条全周期试点项目,开展恶性肿瘤高危风险评估及生物检测,为肿瘤高危人群提供肿瘤基因多组学检测;支持无锡市高层次人才“健康未来计划”,为无锡市高层次人才提供癌症早筛、基因检测服务等。 《“健康中国2030”规划纲要》明确指出:“推动人人参与、人人尽力、人人享有,落实预防为主,强化早诊断、早治疗、早康复,实现全民健康。”相信随着液体活检技术的发展,在不久的将来,多癌种早检技术将真正开启癌症诊疗新时代,造福社会和每⼀个家庭。 注:正文所有图片均来源于Nature Communications doi:10.1038/s41467-023-41774-w. |