刘博谈验证 这是刘博谈验证的第十九篇,在本篇中,我们来讨论如何设计测试的性能评估试验。 在讨论测试性能特征的测量时,首先要描述描述和解释测试性能研究中的一些术语。一个典型研究的设计如下:一系列患者所接受的金标准检测和考核测试,金标准测试被认为是患者真实状态的一个完美指标。结果显示在表2.2中。 表2.2 | 测试性能评估试验 注意:真阳性率(灵敏度)=A/(A+C);假阳性率=C/(A+C);假阳性率=B/(B+D);真阴性率(特异性)=D/(B+D)。 大多数测试性能研究的主要问题是,临床相关人群与研究人群不同,研究人群是指参与评估测试性能的患者,通常是临床相关人群中的一部分。 选择性转诊可能导至接受测试的临床相关人群中只有3%被转诊为金标准测试。在设计测试性能研究前,研究人员需要针对以下问题进行回答。 01 研究人群中的患者是否与临床相关人群中的患者密切相关? 在试验的早期,这两组人之间的差异可能特别突出。 无病的受试者往往是正常的志愿者,对他们来说,测试的假阳性率将低于临床相关人群的预期。 患病的患者往往确实病得很重,因为研究的一个早期目标是确定测试可以测试疾病,如果只包括病情最重的患者,真阳性率将高于临床相关人群。 02 诊断测试结果为阳性是将患者进行金标准测试的前提吗? 理想情况下,答案是否定的,诊断测试和金标准测试应该没有强关联性,那些需要进行金标准测试的患者,往往是由于其他症状的原因才需要进行,而在金标准测试执行前,出于成本或操作等其他原因考虑,才需要进行诊断测试。 实际情况下,医生更倾向于将诊断测试结果为阳性的患者,而不是阴性的患者进行金标准测试,因为后者往往被认为是未患有疾病的患者。 所以如果将诊断测试结果为阳性定义为患者进行金标准测试的前提,那么会存在较大的偏差,真阳性率和假阳性率都将高于临床相关人群的预期。 03 如果诊断测试或金标准测试需要目视解释,观察者是否对患者的所有其他信息保持设盲状态? 当观察者对一个测试的解释受到另一个测试结果的影响时,两个结果之间的一致性可能会增加。 测试审查偏差指的是由知道金标准测试结果的人解释诊断测试的情况,诊断审查偏差指的是相反的情况,即金标准测试是由知道诊断测试结果的人解释的。 这两种偏见都会增加真阳性率,减少假阳性率。 |