癌症筛查测试被认为是早期诊断和生存的关键。这导至投入大量资源开发和实施各种各样的癌症筛查测试。仅在美国,每年就有400亿到800亿美元用于癌症筛查。然而,这些测试对提高生存率的有效性最近受到质疑。造成这种情况的原因包括过度诊断以及不同癌症的不同发病率和死亡率。
一个潜在的解决方案可能是寻找新的生物标志物,理想情况下,这些指标应该可以在外周血中测量。已经提出了数千种潜在的癌症诊断生物标志物。然而,这些生物标志物的临床价值仍然不确定。确定用于癌症筛查的生物标志物涉及巨大的挑战和尚未解决的问题,这些问题尚未得到系统的研究:在常规临床环境中,哪种分子类型在准确性、可追溯性和成本方面是最佳的?对照人群是否健康或是否有合并症对生物标志物有何影响?血液生物标志物与局部肿瘤组织中的相应分析物如何比较?
近日,杂志Communications medicine上发表了一篇题为“Multiomics biomarkers were not superior to clinical variables for pan-cancer screening”的文章。作者利用来自英国生物银行50万参与者的多组学数据,测试基于多组学数据的外周血生物标志物是否可以改善癌症筛查。结果表明,蛋白质组学、代谢组学或基因组生物标志物未显示出优于泛癌症筛查的临床变量,但对于一些高度血管化器官的癌症如肾脏和甲状腺,观察到有希望的结果,AUC大于0.8,可能在临床上有用。
图片来源:Communications medicine
在这项研究中,作者分析了来自UKBB的32,260名86种癌症的患者数据,以调查基于血液的生物标志物和临床变量在诊断癌症方面的有效性。中位年龄为62岁,其中59%为女性。该数据集包括2923种蛋白质、325种代谢物、9000万个遗传变异和45个临床变量。
研究人群的基线特征。
图片来源:Communications medicine
从多组学数据中确定的潜在泛癌症
生物标志物的表现并不优于临床变量
使用机器学习分析来自多组学和临床数据的潜在生物标志物的表现。结果发现癌症患者与健康对照的比较在蛋白质组学、临床变量和基因组学方面产生了相似的AUC (分别为0.75、0.74和0.72)。相比之下,代谢组学最高的AUC仅为0.64。纳入更多特征,AUC仅有略微改善(下图A)。当将癌症患者与非癌症患者进行比较时,基因组学、临床变量和代谢组学的AUC均下降(分别为0.74至0.56、0.72至0.51和0.64至0.54)。
多组学和临床变量在泛癌症诊断中的潜力。
图片来源:Communications medicine
作者研究了是否可以识别个体癌症的生物标志物比如乳腺癌、膀胱癌、结肠直肠癌、肾癌、肺癌、卵巢癌、前列腺癌、甲状腺癌和子宫癌,以及白血病、淋巴瘤和黑色素瘤。对于大多数癌症,来自多组学数据的潜在生物标志物和临床变量的AUC都没有> 0.8(如下图)。四种癌症的蛋白质组学数据产生的AUC远高于其他癌症,肾癌(AUC = 0.97)、肺癌(AUC = 0.86)、甲状腺癌(AUC = 0.89)和白血病(AUC = 0.88)。可能由于这四种癌症位于高度血管化的器官或外周血中,导至局部肿瘤细胞和外周血之间的生物标志物有更大的重叠。
使用不同组学进行癌症预测。
图片来源:Communications medicine
局部肿瘤组织的蛋白质组学分析
显示9种癌症类型的AUC较高
作者分析了来自乳腺癌、结肠癌、头颈癌、肾癌、肝癌、肺癌、卵巢癌、胰腺癌和子宫癌及其相应对照组织的局部蛋白质组学数据。结果发现在所有癌症中,只需一种蛋白质足以区分肿瘤组织和正常组织,中位AUC为1.00(0.91-1.00)。此外,使用多达15种蛋白质时,平均AUC为1.00(0.97-1.00)(如下图)。
仅使用一种蛋白质评估组织恶性的概率。
图片来源:Communications medicine
作者使用来自UKBB的约50万参与者的数据,将癌症患者与健康对照者以及其他诊断的患者进行了比较。结果不支持来自外周血的组学生物标志物比常规临床变量更准确地用于泛癌筛查。一个重要的原因可能是局部肿瘤组织和外周血中分子变化的重叠度多变,除了高度血管化器官中的肿瘤。在高度血管化的器官癌症中,相对少量的蛋白质即可导至个体癌症的高AUC。因此,外周血中此类肿瘤的生物标志物可能被证明在临床上是有用的。
一个局限性是它们仅基于2923种蛋白质和325种代谢物。有可能不同组学生物标志物的组合可能更准确,但这可能会降低临床可追溯性,因为成本和复杂性增加。其次,UKBB的参与者可能不能代表其他国籍、种族或社会经济条件的个体,而且个体癌症的样本量是可变的,这可能会影响模型的稳定性。