有的时候就会出现这种情况:论据都是对的,结论却不成立 这周六晚上,有一篇推文被挺多朋友转发给了我,因为内容很抓人眼球,来自中国台湾地区的高教授团队首次证明:LDCT筛查的广泛使用,在基本不吸烟的年轻女性中会导至过度诊断,可能带来大量的过度诊断和虚高的5年生存率。 朋友们转发的时候都会带一句:那,还做吗? 说实话,这个结论确实有点让人惊讶,因为虽然LDCT的假阳性是个客观存在的问题,但5年生存率又做错了什么? 本着科学严谨的态度,我去看了下原文 在认真读完了原文后,我的观点是:
老规矩,不想看过程的可以直接跳到文末看结论 01 文献的逻辑 这篇文章是个基于台湾官方登记数据的回顾性研究,时间是2004年-2018年,总人群大概是1200万人。作者设定了一个先决条件: 假设真实癌症发病率在这十几年内保持稳定(当然,他认为自己这么设定是吃亏的,因为他认为真实癌症发病率应该是下降的,基于男性吸烟率下降导至的女性二手烟暴露率下降和环境质量改善,不过和结论关系其实不大,不用纠结) 基于此,他用两个标准来评价是否存在过度诊断:
数据分析的结论是:2004-2018年,在1200万女性人口中,有57898名女性被诊断为肺癌。其中早期(0-1期)的发病率从每10万人2.3例增加到了14.4例,而晚期(2-4期)的发病率保持稳定,只是从每10万人18.7例略微增长至每10万人19.3例。同时,死亡率基本保持稳定。 基于此,作者认为:几乎所有LDCT发现的早期肺癌(0-1期)都应该被归类为过度诊断。 要判断这个结论是否成立,应该基于科学的基础,那么第一个问题就是: 什么叫过度诊断? 02 过度诊断 ——“不用管它”&“不如不治” 美国国立卫生研究院(National Institute of Health)有专门的癌症筛查板块,在肺癌这一部分,明确提到了基于LDCT的肺癌筛查可能无法带来健康或生存获益,中间就包括了过度诊断(overdiagnosis) NIH同样给出了明确的过度诊断定义 其特点翻译成大白话就是以下条件二选一: 1. 不用治也不会威胁生命 通常我们管这些被过度诊断的癌症叫indolent cancer(比如甲状腺癌。关于这一点,Grail在其招股说明书中特地强调了Galleri在“放过”indolent cancer上的巨大优势), 2. 治了反而伤害更大 这通常出现在老年患者上,治疗方法的副作用可能显著超过了原本能给其带来的生存获益。比如我们经常在各种影视剧中间看到的极端情况:病人的身体可能下不了手术台。 如果作者的观点是成立的,那么就意味着0-1期的肺癌符合上面a或者b的定义。 03 0-1期肺癌 ——不治真会死,只是早晚而已 肺癌的理论发展过程是:癌前病变-原位癌-微浸润腺瘤(MIA)-浸润性肺癌。 IASLC(国际肺癌研究会)最新版的肺癌TNM分期中,微浸润腺瘤被归类为Ia(mi)期,原位癌被归类为0期,浸润性肺癌则是Ia-IV期都有(根据淋巴结受累和转移情况区分)。 需要注意的是,一旦进入到原位癌阶段,没有任何证据证明这个进展过程在无人为干预的情况下会自己停止。 因此不管是原位癌还是微浸润腺瘤,虽然不是传统定义上I期肺癌,但绝对不属于“不用治也不会威胁生命”,只是因为其发展的速度较慢,所以可以认为它们短期内不会威胁生命:
因此对于预期寿命不足(通俗来说就是预计还能活的岁数不够疾病发展到严重威胁生命)或者身体基础状况过差(也就是通俗说的“可能下不了手术台”)的患者,确实是可以不用干预的。 但对于年富力强、还有大把好时光的年轻人,0-1期肺癌“不用干预”这个结论是无论如何也得不出来的。 在文献附表中更是可以清晰的看到,在早期患者中,I期的占比是绝大多数。就算这些I期都是MIA,如果不干预,大部分就会在3-5年的时间里进展为2-4期。 从这个角度讲,多亏了LDCT筛查的前端阻拦,才守住了台湾地区女性的肺癌晚期发病率的不提升。同时,因为0-1期肺癌极高的治愈率(0期接近100%,I期总体也超过了70%;与之对比4期仅有约5%),这些被LDCT筛查发现的0-1期患者,因其早发现、早治疗且复发率极低,几乎是一己之力拉升了台湾地区女性肺癌的五年生存率:从18%能攀升至40%,遥遥领先其他国家和地区。 所以,作者认为的“过度诊断”其实并不存在。 其实作者在原文中也很委婉的表达了这个观点:筛查可能提前了少数注定要进入晚期的癌症的诊断时间。 只是,这个地方的“少数”可能是“大多数”。 所以,结论是LDCT肺癌筛查没有过度诊断吗?但这个结论同样不成立。 04 LDCT筛查肺癌 ——不因噎废食,也不止步于此 原文中有个数据很有意思:女性跟肺癌治疗相关的手术量在2000年到2018年从800人次增加到8000例。 在附表中2018年台湾女性的0-4期肺癌数如下: 通常肺癌可手术期为0-III期(其实大部分IIIa/b期也是不可手术期),这个总数是3439人,跟手术人数的差值是4561人。 这个还真有可能是LDCT筛查带来的“过度治疗”,这代表可能有4000余名台湾女性因为LDCT拍出了肺结节而选择手术,结果手术后的病理结果并不支持哪怕是原位癌的诊断。 这是LDCT一直以来的问题,因为影像学只能看到“那里有没有长东西”,却无法判断那个东西的性质——尤其在早期,肿物并无浸润表现时。NIH也提示了这种伤害: 从统计学数据来看,LDCT拍出来的肺结节最终被确诊为不是癌症的也并非个例:在美国国家肺癌筛查临床试验(National Lung Screening Trial)中,其特异性大约73%,意味着至少1/4的真·健康人因LDCT检查而走到侵入式检查/手术的人被“伤害“了。 而在真实世界中,这种情况只会更糟糕,因为:概率这种事情,群体可以赌、个人并不敢赌。曾经因为工作原因,我加了好几个肺结节病友群,亲眼看到了他们的焦虑、不安和在手术决定面前的挣扎,但最后只要医生给出手术决策,他们都不会拒绝大抵也是这个原因。这导至在临床实践中,可能被“过度治疗”的人是超过了临床试验中的比例的。 所以,站在“过度治疗”(也可以算某种“过度诊断”)的角度,LDCT虽然是目前最标准的肺癌筛查方法,但其实这个需求还有很多未被满足的地方。 04 做个总结 有两点:
最后说一句,最怕用卫生经济学研究中的群体获益的高低去衡量自身性命的贵贱,群体的事情我们看概率,个人的事情应该看生死,这句话是永恒的真理。 对于个体而言,LDCT肺癌筛查是目前最有效、也最能帮助自己获得早期发现肺癌机会的,绝不能因噎废食。 真正要解决肺癌“过度诊断/治疗”,并不应该去限制LDCT的推广,而是去发展更好的替代性技术。 举个通俗的例子: 我们并不能因为只吃主食不健康,就停止大规模推广杂交水稻。好的解法应该是去琢磨再养头猪或种点菜。 |