刘博谈验证 这是刘博谈验证的第十八篇,需要结合临床的实际情况来评估测试的性能。 从这一部分开始,我们来介绍了诊断试验评估中的核心问题:如何评估测试的性能。 如图2.2所示,一项检验的灵敏度和特异性决定了它对疾病概率的影响,因此,如何解释该测试结果,决定了该测试的性能是否合适。 图2.2 | 测试灵敏度和特异性对测试后概率的影响 图2.2a | 从45度线上方的系列曲线可以看出,测试的假阳性率(用FP表示)是决定测试阳性后的测试概率的重要因素。然而,假阳性率对测试结果为阴性后的测试概率的影响非常小,如45度线下方的系列曲线所示。 图2.2b | 测试灵敏度(用TP表示)对测试结果为阳性后的患病概率影响相对较小,如45度线上方的系列曲线所示。然而,它确实影响到测试结果为阴性后的患病概率,如45度线下方的系列曲线所示,特别是当测试前患病概率很高时。 衡量一项测试的灵敏度和假阳性率的研究很重要,但很难进行。许多研究只适用于狭义的患者,在不同的机构对同一测试的研究可能导至不一致的结果。 例如,计算机断层扫描(CT)经常被用来确定新发现的肺癌的范围,从而确定切除癌症是否有机会治愈患者。如表2.1所示,对肺癌患者的CT研究的调查显示,结果有很大差异。 图2.3 | 显示了测量的测试性能特征的这种广泛差异的后果:如果CT扫描结果为阳性和和阴性,纵隔转移的概率。 在测试前患病概率为50%的情况下,用于计算测试后患病概率的数据取自表2.1中的两项研究,根据使用的是哪项研究,对测试的解释有很大不同。 在使用研究A数据的情况下,可以对测试后患病概率得出较大的变化,那么医生就可以按照下面的方法对测试结果进行解释:如果测试结果为阳性,则表明存在疾病,如果测试结果为阴性,则表明不存在疾病。 而如果使用研究B的数据,人们无法从测试结果中得出任何结论,因为疾病的概率因测试结果而变化很小。这个例子有力地说明了临床决策可以在多大程度上依赖于高质量的检验性能研究。 图2.3 | 测试后纵隔转移的概率。测试前患病概率为0.5。研究A和研究B表示对CT扫描测试纵隔转移的性能的两项研究。测试后患病概率是用贝叶斯定理计算的,使用两个研究中的真阳性率和假阳性率。 |