指导原则中的临床统计部分和IVDstatistics程序的指导思想 芸豆荚 2013/12 一、肿瘤标志物类定量检测试剂注册申报资料指导原则 (3) 统计学分析 ① 数据预处理、差异数据的重新检测或第三方验证以及是否纳入最终数据统计、对异常值或缺失值的处理、研究过程中是否涉及对方案的修改。 ② 定性结果的一致性分析 阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间。以交叉表的形式总结两种试剂的定性检测结果,对定性结果进行四格表卡方或kappa检验以验证两种试剂定性结果的一致性。 ③ 定量值相关性和一致性分析 用回归分析验证两种试剂结果的相关性,以y=a+bx和R2的形式给出回归分析的拟合方程,其中:y是考核试剂结果,x是参比试剂结果,b是方程斜率,a是y轴截距,R2是判定系数,同时应给出b的95%(或99%)置信区间,定量值结果应无明显统计学差异。 另外考虑到在不同的样本浓度区间试剂的性能可能存在一定差异,因此,建议对总体浓度范围进行区间分层统计,对不同浓度区间内的结果进行相关性分析以更好的验证两种试剂的相关性。 二、乙型肝炎病毒脱氧核糖核酸定量检测试剂注册技术审查指导原则 (3) 统计学分析 ① 数据预处理、差异数据的重新检测或第三方验证以及是否纳入最终数据统计、对异常值或缺失值的处理、研究过程中是否涉及对方案的修改。 ② 两组数据结果的相关性、线性回归的结果。 ③ 对相关性及线性方程的显著性检验,验证两种试剂定量结果的一致性。 ④阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间。 ⑤以交叉表的形式总结两种试剂的定性检测结果,对定性结果进行四格表卡方或kappa检验。 另外考虑到对不同样本类型的检测结果可能存在一定差异,故建议对不同样本类型分别进行统计分析,以对考核试剂的临床性能进行综合分析。 三、人类免疫缺陷病毒检测试剂临床研究注册技术审查指导原则 3.统计学分析 (1)数据预处理、差异数据的重新检测或验证鉴别以及是否纳入最终数据统计、对异常值或缺失值的处理、研究过程中是否涉及对方案的修改等。 (2)一致性分析和相关性 相关性主要包括阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间。一般可采用四格表卡方检验或kappa检验对两种试剂定性检测结果的一致性进行分析。 对于定量试剂,应选用特定的数据分析模型(如Bland-Altman 模型)对两种试剂定量分析结果的一致性进行分析。同时,还应采用回归分析的方法分析两种试剂检测结果的相关性,以y=a+bx和R2的形式给出回归分析的拟合方程,其中:y是考核试剂结果,x是对比试剂结果,b是方程斜率,a是y轴截距,R2是判定系数,并给出a和b的95%(或99%)置信区间。由于对不同的HIV-1基因型或者不同浓度区间样本,试剂的性能可能存在一定差异,因此,建议对总体样本,按照浓度范围和/或基因型进行区间分层统计,对不同区间内的结果进行相关性和一致性分析,以更好地验证两种试剂的相关性。 四、流行性感冒病毒核酸检测试剂注册申报资料指导原则 (3)统计学分析
①数据预处理、差异数据的重新检测或第三方验证以及是否纳入最终数据统计、对异常值或缺失值的处理、研究过程中是否涉及对方案的修改。
②阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间。
③以交叉表的形式总结两种试剂的定性检测结果,对定性结果进行四格表卡方或kappa检验以验证两种试剂定性结果的一致性。
另外考虑到对不同样本类型以及不同年龄段人群的检测结果可能存在一定差异,故建议对不同样本类型及不同年龄段人群分别进行统计分析,以对考核试剂的临床性能进行综合分析。 五、流行性感冒病毒抗原检测试剂注册申报资料指导原则 (3)统计学分析
①数据预处理、差异数据的重新检测或第三方验证以及是否纳入最终数据统计、对异常值或缺失值的处理、研究过程中是否涉及对方案的修改。
②定性结果的一致性分析
阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间。以交叉表的形式总结两种试剂的定性检测结果,对定性结果进行四格表卡方或kappa检验以验证两种试剂定性结果的一致性。
另外考虑到对不同样本类型以及不同年龄段人群的检测结果可能存在一定差异,故建议对不同样本类型及不同年龄段人群分别进行统计分析,以对考核试剂的临床性能进行综合分析。 六、流式细胞仪配套用检测试剂注册技术审查指导原则 (3)统计学分析 ①数据预处理、差异数据的重新检测或第三方验证以及是否纳入最终数据统计、对异常值或缺失值的处理、研究过程中是否涉及对方案的修改。 ②相关性和一致性分析 可以采用线性回归的方式验证两种试剂结果的相关性,以y=a+bx和R2的形式列出回归分析的拟合方程,其中:y是考核试剂结果,x是参比试剂结果,b是方程斜率,a是y轴截距,R2是判定系数,同时应给出b的95%(或99%)置信区间,定量值结果应无明显统计学差异。 另外考虑到某些检测指标在不同的样本浓度区间、不同年龄段人群或不同疾病来源的样本可能有较明显的差异,因此,如有必要,建议以上述相关要素为依据分组并对各组数据分别进行统计分析,以更好的验证两种试剂的相关性。 七、病原体特异性M型免疫球蛋白定性检测试剂注册技术审查指导原则 (3) 统计学分析 ① 数据预处理、差异数据的重新检测或第三方验证以及是否纳入最终数据统计、对异常值或缺失值的处理、研究过程中是否涉及对方案的修改。 ② 定性结果的一致性分析 阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间。以交叉表的形式总结两种试剂的定性检测结果,对定性结果进行四格表卡方或kappa检验以验证两种试剂定性结果的一致性。另外考虑到对不同样本类型以及不同人群的检测结果可能存在一定差异,故建议对不同样本类型及不同人群分别进行统计分析,以对考核试剂的临床性能进行综合分析。 八、弓形虫、风疹病毒、巨细胞病毒、单纯疱疹病毒2型抗体及IgG抗体亲合力检测试剂注册申报资料技术指导原则 5.统计学分析 对临床试验结果的统计应选择合适的统计方法,如检测结果一致性分析、ROC分析和阴性/阳性符合率等。对于本类定性检测试剂对比实验的等效性研究,常选择配对2×2表的形式总结两种试剂的定性检测结果,对定性结果进行χ2检验或kappa检验以检验两种检测试剂检测的一致性。统计学分析应可以证明两种方法的检测结果无明显统计学差异,并验证其一致性是否具有统计学意义。以kappa检验为例,除应计算kappa值外,还应对总体kappa值与“0”之间的差别是否具有统计学意义进行假设检验。对于半定量检测试剂对比实验的等效性研究,应在上述统计分析的基础上,根据临床试验数据分布特点,采用Person相关系数等统计方法对考核试剂检测值与对比试剂检测值线性相关关系进行分析。在临床研究方案中应明确统计检验假设,即评价考核试剂与对比试剂是否等效的标准。对于定量检测试剂对比实验的等效性研究,用回归分析验证两种试剂结果的一致性,建议统计学负责人根据试验设计特点,选择适用的回归分析方法,如Deming回归、Passing-Bablok回归分析等。 (3) 临床研究结果及分析 ① 数据预处理、差异数据的重新检测或第三方验证以及是否纳入最终数据统计、对灰区样本、异常值或缺失值的处理、研究过程中是否涉及对方案的修改。 ② 结果的一致性分析 计算阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间。采用适当的统计学方法,对定性检测试剂进行一致性评价,对半定量检测试剂进行线性相关性分析,对定量检测试剂进行一致性分析。另外考虑到对不同样本类型以及不同人群的检测结果可能存在一定差异,故建议对不同样本类型及不同人群分别进行统计分析,以对考核试剂的临床性能进行综合分析。 九、天津市体外诊断试剂(第二类产品)临床研究技术审查指导原则 五、试验数据分析 (一)对临床试验结果的统计应选择合适的统计方法。 1、对定性试剂,应分析考核试剂的敏感性、特异性、阳性预期值、阴性预期值、阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间、考核试剂和对比试剂的一致性(如kappa值)。 2、对定量试剂,应分析考核试剂阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间、考核试剂和对比试剂的一致性(如kappa值)等之外,还应该分析考核试剂与对比试剂的相关性、线性回归、定量准确性及一致性(如Bland-Altman 模型),如入选样本存在不同分型还应进行分组分析考核试剂与对比试剂的相关性、线性回归、定量准确性及一致性(如Bland-Altman 模型)等。 3、对于对比实验的等效性研究,最常用是对考核试剂和对比试剂两组检测结果的相关及线性回归分析,应重点观察相关系数(r值)、回归方程斜率及y轴截距等指标。 4、对于统计方法的选择可以选择多种方法,而不用过于强调一种方法。在临床研究方案中应明确统计检验假设,即评价考核试剂与对比试剂是否等效的标准。 十、C反应蛋白定量检测试剂盒注册技术审查指导原则(征求意见稿) (3) 统计学分析 ① 数据预处理、差异数据的重新检测或第三方验证以及是否纳入最终数据统计、对异常值或缺失值的处理、研究过程中是否涉及对方案的修改。 ② 定量值相关性和一致性分析 用回归分析验证两种试剂结果的相关性,以y=a+bx和R2的形式给出回归分析的拟合方程,其中:y是考核试剂结果,x是参比试剂结果,b是方程斜率,a是y轴截距,R2是判定系数,同时应给出b的95%(或99%)置信区间,定量值结果应无明显统计学差异。 另外考虑到在不同的样本浓度区间试剂的性能可能存在一定差异,因此,建议对总体浓度范围进行区间分层统计,对不同浓度区间内的结果进行相关性分析以更好的验证两种试剂的相关性。 从以上的原则中可以看出,对于诊断试剂的统计学分析基本是一致的,对于定性试剂,主要是1、阳性符合率、阴性符合率、总体符合率及其95%(或99%)的置信区间。2、行四格表卡方或kappa检验以验证两种试剂定性结果的一致性。做完这些统计应该是足够了。这些在IVDstatistics中都有体现。
这里探讨几个统计技术方面的话题:
1、95%的可信区间:目前有好几种算法:可参见程序和帮助文件:个人感觉最常用的是二项分布法,这个算法应该是最准确的算法,但只能用程序算;另外用比较多的Wald法(点估计,近似正态分布法?),这个算法最简单,但准确度较低。
2、配对卡方检验(McNemar)
在国内的教科书中,都是用传统的公式,b+c<40时用校正公式。但在不同的程序中,并不相同,SPSS只采用精确概率法,MedCalc在<25时用精确概率法,而在>25时用校正的公式,而SAS好象只用传统的公式计算。这里我无法认定用哪种算法好,但应都有道理,不能认定为错。我想可能理论上精确概率法最好,但只能用程序算,另外对于很大的数据,可能出现无法计算的情况。 3、一致性检验 这是指导原则中的必选项之一。然而在一般的教科书中,只对Kappa系数计算进行了说明,对于其95%的可信区间和非0检验提的很少。统计上Kappa系数不只应用于配对的四格表,对于半定量的有序数据同样适用,反过来可认为四格表是有序数据的最简单的特例。在这里要注意的事Kappa的标准误有两个,分别用于可信区间和非0检验,计算公式不同,SPSS和MedCalc都没能同时给出计算值,另有限的几篇中文期刊文章竟然不少用错了。关于这两个Se的计算公式在程序的帮助里可以找到,Se(K)用于计算可信区间,Se0(K)用于非0的检验。 定量试剂的临床统计: 1、以上指导原则均指出要进行回归分析,即计算回归方程y=a+bx,相关系数(R)或R2;从统计学角度,对方程进行检验,即a,b的检测,得出直线相关关系是否成立。事实上对方程的检验,对比的检验,还有对r值的检验结果和意义都是一样的,该检验和算法在方法上没有什么异义,教科书以及多数的软件结果都是一样的。在统计上,应该同时对这些值的95%CI进行计算,并作散点图,显示出更多或更直观的结果。注意的是如果数据不呈正态分布,此时r值不应采用简单相关系数,而应计算秩(spearman)相关系数。 2、Bland-Altman分析:这在部分的指导原则中指出来了。Bland-Altman分析主要是作一个图,用差值或比值等,一般来说界外值在5%以内,说明一致性较好,但没有严格的标准。不过从图上可以直观的看出数据的离散程度。 3、t检验或秩和检验,配对定量的数据需不需要t检验?从以上的指导原则上看并没有要求。可能因为是太习惯了吧,大多数人都可能会进行t检验,在算法上,t检验相对简单,也没有什么争议。但如果数据差值不呈正态分布,理论上应用秩和检验。 4、定量数据的描述:拿到一组数据后,应对基本的情况进行描述,描述的量比较多,不过个人觉得太多也没有必要,在IVDstatistics中,提供均值、标准差、最大值、最小值、偏度、峰度,我想应该足够了,另外一个较为形象的描述是作直方图。有些指导原则里写了说样本应尽量均匀分布,我想这一点是很难做到的,非生理的疾病值不会按统计学上理想的状态分布,以偏态分布居多。如果做不到均匀分布,但我想要考察试剂的性能,高、中、低值的相对连续的分布不能有所缺失,用直方图可以直观的表示出来。 5、正态分布:这是进行以上一些检验在统计学上的基本要求。正态分布算法很多,目前认为较好的算法是W检验和D'Agostino检验。在计算方面,正态分布的计算很复杂,只有用程序进行计算。但也有人说,对于正态分布,不用太过计较,t检验等即使非正态分布的数据,计算结果也不会有大的出入。 5、定量试剂的定性计算:这个在不少的指导原则中都提出来了,个人觉得应该对于有参考值的试剂应同时进行定性的统计。 我想进行完以上的统计后,可以形成一个完整的报告了。 半定量试验(有序变量) 半定量检验试剂种类相对应该少一些。在临床统计上,个人觉得和定性试剂有些接近,或定性试剂是半定量试剂的一个特例。在相关指导原则上,明确指出统计方法的比较少。类比于比定性试剂,我想同样是在3个方面进行分析: 1)基础的计算,也就是区间的符合率,这相当于定性的阳性或阴性符合率; 2)差异性检验,在统计上对有序的变量一般采用秩和检验方法,而不是卡方检验。这里需要提出的是,理论上用配对的秩和检验是最合适的,然而配对的秩和检验将相同的结果不列入统计,只比较有差异的结果。由于半定量的试剂相同的结果数据很多,显然这种结果一些情况下能反映试剂的真实性能,这一点在很多文献中都指出来了。个人认为采用单向有序的秩和检验更能反映试剂的实际性能。在IVDstatistics中,可以计算这两种统计结果,供研究都选择。 3)Kappa一致性检验,其意义和定性相同,但对于有序的半定量试剂,理论上应采用(线性)加权的一致性的Kappa一致性检验。简单的一致性忽略了数据间的联系,不如加权的一致性结果准确。 通过以上3个方面的分析,足以判定出临床试验试剂的性能。 |