小桔灯网 › 门户 ›资讯中心› 专栏文章› 开发与验证 › 查看内容

系统误差失控，你的“准确性”数据再好也白搭！

2026-4-15 14:28| 编辑: 沙糖桔| 查看: 158| 评论: 0|来源: 诊断科学

摘要: 在IVD注册的世界里，最可怕的不是看得见的波动，而是那个看不见的、让所有结果都朝着错误方向稳步前进的“偏移”。

大家好，我是诊断科学的刘博。

上次我们聊了“精密度”和随机误差，今天，我想跟你们聊聊另一个更隐蔽、更致命的问题——系统误差。

不知道你们有没有遇到过这种情况：产品的精密度数据漂亮得无可挑剔，重复性、日间CV都控制得极好，可一到方法学比对，或者审评老师追问量值溯源时，就发现结果总是“有规律地”偏高或偏低。你可能会想：“不就是一点点固定偏差嘛，校准一下不就行了？”

大错特错。这点“固定偏差”，就是系统误差，它是IVD注册路上真正的“隐形杀手”。它能让你的“准确性”数据在纸面上看起来完美，却在临床使用中埋下系统性偏移的祸根。今天，我就结合“前车之鉴”和官方指南，跟大家聊聊，如何揪出并驯服这个杀手。

被忽视的真相

我们先明确几个核心概念，这是理解一切的基础。

系统误差指在重复测量中保持不变或按可预见方式变化的测量误差的分量。简单说，就是每次测都朝同一个方向“偏”。

正确度是测量结果期望与真值的一致程度，其度量就是偏倚（Bias）。而偏倚，正是系统误差的估计值。

准确度是测试结果与真值的一致程度，它是正确度（系统误差）和精密度（随机误差）的组合。

看明白了吗？一个检测结果不准，可能是随机波动大（精密度差），也可能是系统性地偏了（正确度差）。更可怕的是，如果你的精密度极好（随机误差小），但系统误差很大，那么你得到的就是一组非常稳定、但偏离靶心的错误结果。这种错误，临床实验室通过日常质控都很难发现，因为它太“稳定”了。

审评老师为什么对方法学比对、量值溯源刨根问底？他们就是在用“放大镜”寻找这个系统性的偏移。你的“准确性”数据，可能只是精密度的“障眼法”。

三大关键环节

系统误差不会凭空产生，它潜伏在研发和验证的关键环节。我们从知识库的指导原则和核查案例中，可以清晰地看到它的踪迹。

第一个关键环节，是方法学比对，它是评价正确度（即系统误差）的核心手段。《定量检测体外诊断试剂分析性能评估注册审查指导原则》（2022年第32号）等多份指导原则都明确指出，方法学比对的目的是通过偏倚估计来评价正确度。

但做比对，陷阱重重。

首先，如果你选的“对比方法”本身就有未知的系统误差，那你的比对结果毫无意义。《体外诊断试剂分析性能评估（准确度-方法学比对）技术审查指导原则》强调，应选择参考测量程序或质量公认的已上市试剂。

其次，样本只集中在某个区间，可能会掩盖在医学决定水平处的显著偏倚。指导原则要求浓度应覆盖测量区间，并评价关键浓度点的偏倚。

最后，如果只做简单的相关分析，不深入做Bland-Altman分析来揭示固定偏倚和比例偏倚。很多分析忽略了差值均值的置信区间是否包含0，而这正是判断是否存在固定系统误差的关键。

我曾见过一份报告，相关系数r>0.99，但Bland-Altman图清晰显示，所有点都系统性地高于对比方法均值线。这就是典型的系统误差，但差点被优秀的“相关性”掩盖。

第二个关键环节，是标准品/校准品赋值。这是系统误差的“重灾区”，也是审评体系核查的重点。我们来看一些活生生的例子：

比如，某企业没有《工作校准品制备规程》，仅描述“参考品稀释10倍”制成。没有规定稀释基质、分装体积，导至不同批次基质不一致，引发校准曲线斜率漂移（>5%）。这就是可预见的、批次间的系统误差。

再比如，规程规定用日立7180赋值，实际用了日立008as。设备变了，性能差异直接导至赋值系统发生未知偏移。这是因变更失控引入的系统误差。

还有，规程要求在不同时间点重复3个轮次测试以控制设备漂移，但实际连续测试，导至时间相关的系统误差未被剔除。这是流程执行不规范引入的系统误差。

以及申报资料声称溯源至国际标准，实际却溯源至第三方试剂校准品，且未验证其互换性。这导至整个检测系统的量值自带一个无法评估的系统性偏移。

《D-二聚体检测试剂注册审查指导原则》也明确指出，当溯源至制造商选定测量程序时，必须确保各层级校准品赋值准确可靠。赋值过程中的任何一步“差不多”，最终都会累积成临床样本检测结果的“差很多”。

第三个关键环节，是参考区间建立。这看似是后期工作，实则从样本选择开始，系统误差就可能介入。

如果建立参考区间的健康人群样本，是用一个存在系统误差的方法检测筛选的，那么所谓的“健康”范围本身就是偏的。

另外，如果建立参考区间的研究所用检测系统，与最终产品上市时的检测系统，如果存在系统差异（如换了试剂批次、校准品赋值方案），那么建立的区间将不适用。《WST 404.5-2015临床常用生化检验项目参考区间》提到，验证参考区间时，若失败，首先应评价分析系统的正确度。

如何系统性地防控？

知道了杀手在哪，我们该如何布防？

首先，在性能评估中，必须将正确度（系统误差）评价放到和精密度同等甚至更重要的位置。不要满足于一个好看的回收率或相关系数，必须深挖偏倚的大小、方向和临床可接受性。

其次，应该对照《GBT 21415-2025体外诊断医疗器械建立校准品...计量溯源性要求》和核查中发现的共性问题，逐项自查：

你的赋值规程是否完整、可操作？
实际使用的设备、物料、流程是否与规程100%一致？
你的溯源链是否清晰、完整，每一步是否有据可查？
是否做了互换性评估？特别是当校准品基质与临床样本不同时。

接下来，采用CLSI EP09c等推荐的方法深化方法学比对分析。不仅要看回归方程，一定要做Bland-Altman分析，观察差值均值（固定偏倚）及其置信区间，以及差值是否随浓度变化（比例偏倚）。并在医学决定水平点，定量评估偏倚的临床影响。

然后，要保持全流程的一致性，确保从研发、性能验证、注册检验到稳定性考察，所使用的核心物料（如校准品、质控品）和检测系统必须一致。避免出现“研究用A品牌，申报用B品牌”的致命伤（如核查案例所示）。

最后，在建立或验证参考区间时，如结果不符，首先应怀疑并验证检测系统的正确度是否存在系统误差。

写在最后

同志们，系统误差不像随机误差那样“喧闹”，它安静而固执。它可能源于研发初期一个不经意的假设，生产环节一次未被记录的变更，或是验证过程中一次对“微小偏差”的妥协。

审评老师的追问，是在帮我们把杀手的藏身之处。我们应该感激这种严格，因为它逼着我们建立起对“正确”的敬畏。

在IVD注册的世界里，最可怕的不是看得见的波动，而是那个看不见的、让所有结果都朝着错误方向稳步前进的“偏移”。控制住系统误差，我们的“准确性”数据，才能真正承载起对临床的承诺。

声明：

1、凡本网注明“来源：小桔灯网”的所有作品，均为本网合法拥有版权或有权使用的作品，转载需联系授权。
2、凡本网注明“来源：XXX（非小桔灯网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有，如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

收藏分享邀请

上一篇：IVD人必看！随机误差与系统误差的核心区别及临床意义解析

系统误差失控，你的“准确性”数据再好也白搭！

声明：

最新评论

相关分类

官方推荐 /3

个人中心