刘博谈验证 这是刘博谈验证的第三十三篇,在本篇中,我们来讨论成本、目标和比较,这些临床验证方案设计中需考虑的问题。 4.1.4、成本 在当前成本控制和资源有限的时代,对成本的考虑将是一个重要的研究终点。 第一,计划进行技术验证的研究者必须决定使用哪种类型的分析(例如,净资源成本、成本效益分析或成本效益分析),由于成本效益分析是比较性的,不需要用货币来评价健康结果,所以它是最经常使用的分析类型。 第二,研究者必须为分析选择一个合适的角度,因为这将极大地影响哪些成本和效果被包括在内。社会视角是最广泛的,当成本效益分析的结果需要指导政府决定如何分配资源时,就会采用这种视角。 第三,研究者必须认识到,当研究设计中包括经济验证时,在多大程度上需要额外的时间和人员。 4.1.5、验证的目标 研究的条件可以模仿现实生活,也可以是理想化的。疗效(检测在理想条件下的表现)和有效性(检测在普通临床实践条件下的表现)之间的选择将决定研究能够回答的问题的类型。 表2|疗效研究与有效性研究的不同要求 有效性研究将招募所有在临床实践中被怀疑患有疾病的患者。患者将得到通常的检测前指导,尽管有些人准备得不是很充分,但所有患者都将接受检查。 检查将在通常的条件下进行,由通常进行检查的人进行检查。检查结果将由不同技术水平的临床医生进行解读,他们将获得当时普遍存在的任何临床信息。不会有后续患者护理的协议。 疗效研究应验证该技术在理想条件下应用于特定人群的特定临床问题时的潜在益处。该方案将被设计成通过减少变异性的来源来最大限度地证明检测的真正准确性。因此,疗效研究将:
研究者可能会对哪种验证方式最合适产生分歧,有一种方法被用来来概念化这两种不同的设计:“快速”和“实用”。 A、快速 快速的设计者可能包括生物统计学家或开发技术的科学家。他们认为,疗效研究是确定技术“真正”价值的唯一途径。 例如,疗效设计将增加对研究问题得出明确答案的机会,因为它使程序标准化,并消除了临床实践中的许多变异性来源。如果这样的研究得出的结论是某项检测没有疗效,那么就没有必要再进行进一步的验证了。 B、实用 这种方法将被实践中的临床医生所采用。疗效验证的“干净”结果对医生来说可能没有什么价值,因为患者将在“通常”而非“理想”的条件下接受检测。实用主义者认为,只有试图模仿临床现实的有效性研究才能为医生提供对个体患者做出决定所需的信息。 解决严格和实用主义方法之间的冲突可能需要结合两者的特点。 在任何情况下,实际执行的方案最终都可能是一个混合体,因为为验证疗效而设计的方案往往会遇到现实世界的障碍,使理想的安排无法实现。 这些问题将在本章考虑实施的部分中详细介绍。 4.1.6、比较性验证 在第三章中,我们强调技术验证必须是比较性的,如果它们要为执业医生提供有用的数据。 例如,医生可能需要回答以下任一或两个问题:
这些问题提出了两种比较设计(见图2)。 在一种设计中,研究将检测新检测取代旧检测时的任何积极影响。患者将被随机分配到新技术或现有技术。 在另一种设计中,研究将验证一项技术作为补充使用时的影响,患者将被随机分配接受旧检测和新检测的顺序,或单独接受旧检测。 这两种设计都可以用来比较检测(或检测组合)的诊断准确性及其对疾病结果的影响。 图2|比较验证试验的方案设计 在对现有技术和新技术进行比较时,上述哪种设计更合适? 尽管有很好的报告,医生们可能会在短期内犹豫是否要完全改用一种新技术,一个附加的设计将回答他们关于使用新的检测作为序列的一部分的问题。 然而,技术验证的一个目标是促进实践习惯的适当改变,并阻止使用不会产生影响的额外检测。 从长远来看,如果我们想鼓励医生放弃无效的检测而选择更有效的检测,我们也需要验证技术的替代价值。 另一个在设计阶段必须解决的问题是现有诊断方法的高度准确性。 随着诊断方法的改进,测量准确度的微小差异需要大量的样本人群。 在一项对279名胰腺疾病患者的研究中,CT检测异常胰腺的敏感性为0.87,超声检查的敏感性为0.69(差异为0.18)。要证明另一种技术(如MRI)优于CT,需要更大的样本,因为灵敏度的最大可达到的差异是0.10或更小。 在开始比较研究之前,研究者应该问,这种敏感性的微小差异是否具有临床意义。在此,使用第2章中描述的阈值模型有时可能会有帮助。 为了达到这个目的,我们必须选择一个具体的临床问题,并估计疾病的检测前概率。我们还必须计算出一个治疗阈值概率。 这一步最好通过决策分析模型来完成。 当旧检测(灵敏度为X)的阴性结果之后,检测后的疾病概率超过阈值时,我们就对患者进行治疗。 让我们假设新检测的最大灵敏度为X+0.10。如果新检测结果为阴性后的疾病概率仍然高于阈值,我们的治疗策略将不会改变。 因此,灵敏度的不同对患者的护理没有实际意义。 要全面分析一项检验对决策的影响,需要了解研究人群中检验前概率的分布和患者的效用,而这些额外的数据要求是巨大的。 当然,即使准确度的差异不值得验证,我们也可能想验证一个新检测的其他特征,如增加安全性或减少成本。 |