在诊断试验中,一种新的体外诊断试剂通常与金标准或已上市同类产品进行一致性比对,以评价两种检测方法结果是否一致。通常,在统计方法选择上,我们会优先选择Kappa一致性检验。Kappa是用来描述定性(分类)任务中标注一致性的统计量。 Cohen's Kappa和Fleiss' Kappa是比较常见的Kappa,Cohen's kappa 和 Fleiss' kappa 是两种以人名命名的统计学方法。前者只能用来评估两位观察者之间的一致性,如评价考核试剂检测结果与已上市同类产品的一致性,后者可以衡量多个观察者对多个对象进行分类时的一致性程度。在IVD临床试验中,主要使用Cohen's Kappa进行一致性分析,因此,本文将重点介绍。 1.Cohen's Kappa 1960年Cohen等发表了"A coefficient of agreement for nominal scales"一文,首先提出用Kappa值作为评价一致性程度的指标。他提出的Kappa标准误计算公式(1960年Cohen)为: 后来,有学者提出以上标准误计算公式有误,如Everitt,1968年试图修正,但他的计算公式也同样存在错误。 直到1969年,Fleiss, Cohen 和Everitt三大巨头强强联合,发表了"Large Sample Standard Errors Of Kappa and Weighted Kappa"的重要论文,对标准误计算公式进行了修正。在论文中根据原假设不同,Kappa值标准误采用不同计算公式。如原假设为κ = 0,标准误计算公式为: 2.Kappa值标准误计算现状 值得一提的是,目前国内关于Kappa值标准误的计算也基本上分为两派。一派采用Cohen(1960)计算方法,该方法计算简单,易于被大家所接受;一派采用Fleiss(1969)计算方法。但通常来说统计专业人员更倾向于选择Fleiss(1969)计算方法。 在《对诊断一致性kappa系数及评价指标的探讨》一文中,Kappa系数的标准误Sk也被写成: 实际上,这种写法与前者是一致的,只不过前者使用频数,后者使用频率进行计算。 在《Kappa一致性检验在检验医学研究中的应用》一文中,Kappa系数的标准误Sk被写成: 总之,以上两种方法目前均有在使用,具体使用哪种方法读者可自行选择。 参考文献 [1] Cohen, J. (1960). A coefficient of agreement for nominal scales. Educational and Psychological Measurement, 20, 37–46. [2]Fleiss, J. L., Cohen, J., & Everitt, B. S. (1969). Large sample standard errors of kappa and weighted kappa. Psychological Bulletin, 72(5), 323–327 [3]闫岩,华琳,张建. 对诊断一致性kappa系数及评价指标的探讨[J]. 中国卫生统计,2007,24(3):313-315. [4]夏邦世,吴金华. Kappa一致性检验在检验医学研究中的应用[J]. 中华检验医学杂志,2006,29(1):83-84. |