在保证研究结论具有一定可靠性(精度和检验效能)的前提下,常需要在设计阶段估计所需的最少试验单位数,在临床研究过程中盲目增加研究样本量会增加实际工作的困难,从而导至人力、物力和时间的浪费,同时增加研究样本量,会使实验条件更难控制,也将使样本人群中包含较多的混杂因素,对研究结果可能造成一定的影响。 另外,当研究工作假设检验的结果没有显著性时(P>0.05),也应该考虑是否没有采用足够的样本量以致检验效能偏低。因此确定合适的样本量应该是临床研究中首先考虑的重要问题。 体外诊断试剂临床试验的样本量与多种因素相关,如检测的可重复性、干扰因素、亚组间的差异性,以及被测物特点等。临床试验方案中应对临床试验需要的最低样本量进行估算,并说明依据。 一、通过统计学进行样本 量估算的基本考虑 (1)临床试验样本量应满足统计学要求,可采用适当的统计学方法进行估算。 (2)临床试验样本量的确定需结合诊断试剂的具体情况,保证临床性能得到充分验证,如需要对不同亚组人群分别进行评价的情况、产品检测多种被测物(或多种亚型)的情况等。有必要在估算最低总样本量的基础上,进一步细化各种组别/类型样本的例数要求。 (3)如临床试验包含不同的临床性能评价目的,需分别进行统计学分析,则针对每种情况均应有足够的样本量。 例如,临床试验目的包括: ①评价试验用外诊断试剂与同类产品的等效性; ②评价试验用体外诊断试剂用于疾病鉴别诊断的敏感性和特异性,则临床试验样本量需满足上述两项临床性能评价的要求。 (4)对于定量检测试剂,检测结果的浓度在检测范围内及医学决定水平处地应有一定量的样本例数;对于定性检测试剂,临床试验样品检测结果在阳性判断值附近或灰区内应有一定量的样本例数。 二、估算样本量的决定因素 2018年11月22日,国家药品监督管理局关于 样本量估算需要考虑的因素主要有资料性质、统计分布、检验水准、检验效能、单双侧检验和平衡与否等。 (1)资料性质:选择定量设计还是定性设计。 (2)统计分布:不同的检测结果可能具有不同的统计分布,而不同的统计分布所采用的统计推断方法不同,样本量估算方法的选择应与检测结果的统计推断方法保持一致。例如,计划对检测结果采用卡方检验时应基于卡方检验进行样本量估算,而计划采用Fisher确切概率进行检验时则不应基于卡方检验进行样本量估算。 (3)检验水准:即假设检验第Ⅰ类(α)错误出现的概率,为假阳性错误出现的概率。α越小,所需的样本量越大,反之就越小,常取双侧α=0.05的水准。 (4)检验效能:又称把握度,为1-β,即假设检验第Ⅱ类(β)错误出现的概率,为假阴性错误出现的概率。β越小,检验效能越高,所需的样本量越大,反之就越小。检验效能通常不得低于80%,也就是说把握度至少为80%。 (5)单双侧检验侧:医学研究领域的统计检验通常使用双侧检验,单侧检验的样本量会明显小于双侧检验的样本量。如果采用单侧检验,需要给出充足的理由。 (6)平衡或非平衡设计:平衡设计即每组的样本量相同,在其他条件不变时,各组样本量相同时平衡设计效率最高,即试验所需总样本量最小。非平衡设计是指比较组间的样本量有明显差别,习惯上这种差别成倍数关系。 7) 总体的相关信息如均数比较时需要了解个体变异大小即总体标准差δ,率的比较需要了解总体率π的大小,相关分析时需要了解总体相关系数ρ的大小。δ越大,所需要样本量越大;总体率π越接近于0.50,所需要样本量越大;ρ越小,所需要样本量越大。δ、π、ρ一般未知,通常以样本的s、p、r作为估计值,多由预实验、查阅文献、经验估计而获得。 (8)处理组间差别δ的估计,即确定容许误差。如δ=π1-π2或δ=μ2-μ1,若研究者无法得到总体参数的信息,可以通过预试验来估计,也可以根据专业要求由研究者规定。用样本指标估计总体指标常有一定的误差,故要确定一个样本指标与总体指标相差所容许的限度。δ值越小,样本量则越大。 |