一、 前言
本指导原则主要针对第二代测序(next generation sequencing,NGS)技术检测试剂(以下简称“NGS检测试剂”)产品质量提出指导性要求,涉及基本原则、主要原材料、检测流程及性能评价等方面。
本指导原则是对企业和检验人员的指导性文件,但不包括注册审批所涉及的行政事项,亦不作为法规强制执行,如果有能够满足相关法规要求的其他方法,也可以采用,但是需要提供详细的研究资料和验证资料。应在遵循相关法规的前提下使用本指导原则。
本指导原则是在现行法规和标准体系以及当前认知水平下制订的,随着法规和标准的不断完善、科学技术的不断发展,其相关内容也将进行适时的调整。
二、 适用范围
本指导原则适用于基于NGS技术的检测试剂的质量评价。NGS检测试剂的预期用途包括但不限于以下内容:肿瘤相关基因异常、遗传疾病相关基因异常、胚胎植入前染色体非整倍体、胎儿染色体非整倍体及病原微生物等临床检测应用。此类检测试剂涉及的NGS技术包括靶向性测序和非靶向性测序:靶向性测序法是指对样本中的基因组进行部分测序,如靶基因测序、外显子(组)测序等;非靶向性测序是指对样本中潜在生物体的基因组进行测序。原则上不建议企业应用全基因组测序进行检测,如果企业应用全基因组测序技术,应进行充分的技术适用性验证并提交报告。
待测样本可以是人源样本(如体液、组织、排泄物等)或病原微生物分离培养物(如血培养物、痰培养物等),检测对象可以是脱氧核糖核酸(DNA)、核糖核酸(RNA)或两者的混合物。
本指导原则尽可能覆盖所有的NGS技术原理和测序平台,所讨论和描述的内容不限于某个特定的NGS检测试剂。但鉴于NGS技术一直在不断升级和更新,可能会有本指导原则未能涉及的新技术。
三、 基本要求
(一) 基本原则
1. NGS检测试剂的生产企业应获得《医疗器械生产许可证》。研制、生产用的各种原料、辅料等应制定其相应的质量标准,并应符合有关法规的要求。
3. 试剂生产企业应具有与其技术要求相适应的人员、厂房、设施和仪器设备以及适宜的生产环境。建立专用实验室,实验室应当严格分区,人员和物品应当单向流动,以最大限度地防止实验过程中样本之间的污染和避免扩增产物的污染。生产用于病原微生物核酸检测的生产企业应建立符合生物安全要求的设施和措施。
(二) 主要原材料
NGS检测试剂的主要原材料包括实验原材料和数据分析原材料。实验原材料包括引物、探针、酶、参考品或标准品等,企业应提供尽量完整的研究资料,如选择与来源、制备过程、质量分析和质量标准等;数据分析原材料包括数据库(参考序列)、生物信息学分析软件及数据储存中心等。数据分析原材料能影响检测结果,企业应提供尽量完整的研究资料,如数据库(参考序列)的溯源性、生物信息学分析软件的算法以及数据储存中心的安全性与稳定性等。
对于实验原材料,若企业自己生产,其生产工艺必须相对稳定;若来自市场(从其他单位购买),应提供的资料包括:对供应商审核的相关资料、购买合同、供货方提供的质量标准、出厂检定报告,以及该原材料到货后的质量检验资料。原材料或其供应商发生变更,应依据国家相关法规的要求进行变更申请,并重新对产品进行性能验证。
对于数据分析原材料,若企业自己提供,应具有完整的生物信息学分析软、硬件能力,制定相应的开发、维护及升级等方案;若来自市场(购买服务或产品),应提供相应的验证资料及后续的维护、升级等方案资料。如材料发生变更,应重新对产品进行性能验证,并依据国家相关法规的要求进行变更申请。
建议企业提供的详细资料包括但不限于以下内容:
1. 核酸提取、分离及纯化组分的主要组成、原理介绍及相关的验证资料,需覆盖产品检测涉及的各样本类型。
2. 测序文库构建组分的主要组成、原理介绍及相关的验证资料
构建测序文库的主要原料(脱氧三磷酸核苷、接头序列、连接酶、聚合酶、逆转录酶、限制性内切酶、引物、探针、接头及其他主要原料)的选择、制备、质量标准及研究资料。如以上原材料来自市场,企业可提供供应商出具的质检报告。如供应商提供的原材料为混合体系,可提供针对混合体系的质检报告。
2.1 脱氧三磷酸核苷(dNTP) 核酸的组成成分,包括:dATP、dUTP、dGTP、dCTP和dTTP;建议提交对纯度、浓度及保存稳定性等的验证资料。
2.2 引物、探针及接头
引物、探针及接头均是由一定数量的dNTP构成的特定序列。探针带有特定的标记物,能与互补核酸序列退火杂交,用于特定核酸序列的探测和捕获。接头包括条码(barcode)或标签(index),用于将待测核酸与测序载体连接、区分不同来源的样本等。
建议企业提交序列选择、制备方法、质量标准,以及对分子量、纯度、保存稳定性、功能性实验等的验证资料。如果为外购,需提供合成机构出具的合成产物的质检证明。
2.3 连接酶、聚合酶、逆转录酶及限制性内切酶
连接酶、聚合酶、逆转录酶及限制性内切酶应具有相应的酶活性。建议提交酶活性、热稳定性及工作效率等验证资料。
3. 参考品或标准品原料选择、制备、定值过程、稳定性研究及性能验证等资料。
4. 核酸类检测试剂的包装材料和耗材应无脱氧核糖核酸酶(DNase)和核糖核酸酶(RNase)污染,建议提交相应检测报告。
5. 数据库(参考序列)
数据库(参考序列)用于NGS检测试剂的生物信息学分析,辅助测序比对拼接和测序结果确认。建议企业提交数据库(参考序列)的溯源信息、数据库类型(本地数据库、在线数据库)、完整性、实时性、维护以及升级方案等资料。
6. 生物信息学分析软件
用于对原始测序结果进行分析并报告最终检测结果。建议企业提交分析软件的版本、算法、性能验证以及升级方案等资料。
7. 数据存储中心
用于储存原始和经过分析后的检测结果,可以是本地或云储存中心。建议企业提交数据存储中心的安全性、稳定性、维护与升级方案以及异常情况处置方案等资料。
(三) 检测流程
NGS检测试剂的检测流程可以分为样本收集、样本制备、测序、生物信息学分析及报告和数据库管理等五个环节。企业在设计开发过程中应充分考虑每个环节的质量控制,并进行验证。
1. 样本收集
样本可以为人体样本(如体液、组织、排泄物等)或病原微生物分离培养物(如血培养物、痰培养物等)。样本的获取及预处理方式、保存条件及期限(短期、长期)、运输条件等若有通用的技术规范或指南,则应遵循,并引用;若没有通用的技术规范或指南,则企业应该设立自己内部的标准操作流程,以保证样本的质量,并且防止样本间的混淆与交叉污染。不同类型的样本所抽提的核酸的质量可能有所差异,对于每一种类型的样本,应当明确检测所需样本的用量。如样本不符合要求,应重新取样。
企业需明确标识出以下内容,包括产品适用的样本类型、采集时间、采集部位、采集方式、采集量及保存和运输条件等内容。样本的采集时间的选择需考虑是否受临床症状、用药情况等因素的影响;采集部位应考虑样本的代表性、操作的难易程度及安全性等因素;采集方式应详述具体的操作方法或列出相关操作指南文件以指导使用者(含图示);企业根据产品预期用途,设计具体的采集量标准,企业应明确采集量判断标准及方法;保存和运输条件应保护样本中的核酸,企业应明确样本的保存条件(温度、湿度等)及期限(短期、长期)、运输条件(温度、湿度等)及反复冻融限制等。
2. 样本制备
2.1 核酸提取、分离及纯化
样本中核酸的提取、分离及纯化的主要目的是为了富集核酸浓度并保证核酸序列的完整性。企业应在NGS检测试剂的设计开发过程中对配套使用的核酸提取、分离及纯化试剂进行匹配性验证,以确保其性能满足检验的需要。企业应明确检测所需核酸的最小用量。
企业应该设立核酸抽提及抽提后质量控制的书面标准操作流程,并依据性能验证结果在此给出用于扩增试验的核酸溶液浓度范围要求,以保证核酸样本的质量与浓度符合要求,并且防止样本间的混淆与交叉污染。企业应当对抽提的每一次核酸样本的各种质控参数有详细的记录,建议包括但不限于核酸体积、质量、浓度、纯度及完整性等。核酸浓度、纯度检测方法包括但不限于分光光度法、荧光法等;核酸完整性检测方法包括但不限于琼脂糖凝胶法、实时荧光定量PCR法等。如果提取、分离及纯化的核酸样本质量不符合要求,应重新取样或扩大样本量再进行核酸分离/纯化。
2.2 靶向序列富集及测序文库构建
靶向序列富集是指靶向性扩增一定大小的核酸片段,企业应对富集原理及方法进行详细描述。企业应制定标准操作流程及质量控制方案,记录包括靶向序列片段的浓度、纯度及大小等参数。
企业根据具体的测序平台的性能特点,对核酸序列进行片段化处理,片段的长短应符合后续测序的要求,片段化方法包括但不限于超声法、酶切法等。企业应制定核酸序列片段化操作流程及质量控制方案,对经过片段化的核酸短序列的浓度、纯度及大小等参数进行检测并详细记录。
2.3 添加接头(条码或标签)
测序文库中的短核酸片段需要与测序载体连接后才能进行测序反应,这一连接过程需要先给短核酸片段添加接头。NGS技术可以实现将多个来源不同的样本混合后在一个测序反应中同步检测,为了区分这些样本,通常采用在每一个原始样本的测序文库中加上唯一的寡核苷酸标签的方法进行标记,这些寡核苷酸标签被称为条码或标签。条码和标签可以包含于接头序列内,也可以独立于接头序列。
添加接头可以是独立的步骤,也可以在靶向序列富集过程添加。企业使用条码或标签时,需充分验证并满足测序所需的质量要求,如测序深度、覆盖度等条件。同时,企业应对潜在的问题进行充分研究,包括但不限于:条码检出率的均匀性、条码互换比率以及条码间相互污染或干扰等因素。企业应报告有效的条码或标签数量,并对每个条码或标签的序列及其位置有详细、清晰的记录。
3. 测序
3.1 测序平台
目前商业上常用的第二代测序平台根据测序原理可分为光学技术 (Illumina公司、华大基因公司为代表)和半导体技术(Thermo公司为代表)。每个测序平台都有各自的特异性参数,包括仪器大小、通量、读长、运行时间及测序成本等,企业应结合具体的临床应用需求选择合适的测序平台。
3.2 测序及碱基读取
企业应根据所选用的测序平台,选择合适的参数指标对测序质量进行监控,制定相应的管理制度及质量标准,并明确失控情况下的纠正措施。企业应根据具体应用情况,如测序区域的大小及序列特征等因素确定测序所需要的覆盖度及深度。在测序过程中,企业应建立标准操作流程及质量控制方案监控整个测序过程当中的测序质量。企业应根据具体的预期用途,制定产品的测序覆盖度和深度,并提供充分的理论依据及验证结果。
碱基读取是指识别一段基因序列片段每一个位点的核苷酸的过程。不同测序平台具有不同的测序偏好性,可影响碱基读取过程中的错误类型与比率。应用软件可以消除或部分抵消测序偏好性的影响,提高碱基读取的准确性。碱基读取后,企业应对每个碱基读取的质量进行评估。若碱基读取质量有通用标准,则应遵循并引用;若没有通用标准,可根据具体应用情况制定碱基读取质量评价标准及分析方法,并提供充分的理论依据及验证结果。
4. 生物信息学分析及报告
企业应对生物信息学分析流程有完整的记录,建立完善的生物信息学分析软件的版本控制方案。企业应建立生物信息学分析流程标准操作流程及质量控制方案,保证测序数据的分析、解读及报告的准确性与严谨性。生物信息学分析应报告具有明确临床指导意义的结果。
4.1 序列比对拼接
序列比对是指利用生物信息学软件,将短的测序片段与参考序列进行比对后完成拼接的过程。参考序列应具有明确溯源性,可以是全基因组序列或基因片段序列。若预期用途为检测未知病原微生物,难以提前确定参考序列,可以将测序结果进行互相比对,在此基础上完成长序列的拼接。
不同的序列比对软件的准确性、特异性及比对速度等方面均有差异,企业需根据具体需要进行选择。企业需要评估序列比对的质量,若比对质量有通用的标准,则应遵循,并引用;若没有通用的标准,则企业应当设立自己内部的标准,以保证比对结果的准确性。
4.2 待测基因序列的确认
决定检测结果准确性的因素包括但不限于测序均匀度、覆盖度和测序深度等。一般地,测序均匀度越好,覆盖度越广,深度越深,待测基因序列的拼接结果越准确。待测基因序列中某些特殊区域的测序深度可能很低,可据此设置产品的最低检出限。企业需要对样本测序结果各个位点的测序覆盖度和深度有明确的计算方法和详细的描述。
4.3 文件格式
生物信息学分析结果的输出格式有很多种,但是无论何种格式的文件必须包含文件结构和数据组织形式的说明,以及其它格式文件和生物信息学分析软件的兼容性说明。建议使用通用的文件格式,如比对结果使用“.bam”文件或其他,测序结果使用“.fastq”文件或其他。如果企业采用自己内部的标准格式文件,应建立该标准格式的详细说明,并注明该文件格式与其它格式的兼容性及相互转换的方法。
4.4 检测结果解读与报告
若预期用途为检测病原微生物,检测结果应明确测序样本中是否含有待测病原微生物。如果是分型检测试剂和耐药突变检测试剂还要明确报告病原微生物的型别及耐药突变位点信息。
报告中建议包括但不限于明确的检测结果,检测方法及局限性等内容。原则上禁止报告中出现超出产品预期用途的检测项目及结果。企业应制定明确的检测结果解读与报告的标准操作流程,对不明确的检测结果以及非预期检测结果应有详细明确的处置方案。
5. 数据库(参考序列)及数据储存
数据库(参考序列)的易用性、准确性及全面性等因素对于检测结果的正确解读极为重要。企业应结合产品的具体使用情况选择数据库(参考序列)并明确其溯源性。无论选择何种类型的数据库,企业应对最终的检测结果负责。若企业使用自建的数据库,应制定完整的维护方案(实时和定期维护方案)对数据库内容进行增补或剔除,从而确保数据库的准确性及全面性。
NGS检测产生的数据量巨大,企业应当制定合适的数据存储方案。数据存储方式可为本地或云存储,无论选择哪种方式,企业应充分考虑数据存储的时限性、安全性及稳定性等因素。对于已储存数据的重新访问与分析,企业应进行详细记录(如访问时间,访问人员、访问内容及访问目的等信息)。对于已存储的数据,原则上允许对其进行基于新预期用途的重复分析,但禁止出具新的检测报告。
(四) 性能评价
1. 核酸提取、测序文库构建
核酸提取的完整性和纯度以及测序文库构建的质量都能影响检测结果,因此应对上述步骤进行质量控制。建议的质量控制因素包括但不限于以下各项:用于核酸提取的样本质量、体积;核酸浓度及核酸定量方法;核酸纯化的质量及检测方法;测序文库的核酸质量、浓度及片段大小等。
2. 阴性、阳性参考品
2.1 预期用途为检测人源基因
阴性参考品应涵盖产品说明书中的预期用途与检测范围的野生型样本,检测结果应为阴性;
阳性参考品应涵盖产品说明书中的预期用途与检测范围的变异型样本,检测结果应为阳性;
2.2 预期用途为检测病原微生物
阴性参考品应包括与待检病原微生物种属相近、临床症状相似的病原微生物,且应混入适量(参考临床水平)的人源基因组。相应检测结果应为阴性;阳性参考品应包括产品说明书中预期用途与检测范围待检病原微生物,且应混入适量(参考临床水平)的人源基因组。相应检测结果应为阳性。
3. 最低检出限
建议可以从扩增反应终体系核酸浓度或基因变异序列所占百分率两方面对最低检出限进行评价。NGS检测试剂具有同时检测多个检测位点或靶点的能力,可将多个最低检出限参考品混合进行检测,但应分别报告各个位点或靶点的最低检出限结果。若预期用途为检测人源基因,最低检出限参考品应覆盖所有基因变异类型;若预期用途为检测病原微生物,最低检出限参考品应覆盖所有待测病原微生物。
建议最低检出限参考品
优先使用临床获得的生物样本(细胞系、病原微生物等);对于某些难以获得的样本(如罕见基因类型、难以分离培养的病原微生物等),可以使用核酸模拟样本(如假病毒、核酸片段、质粒等)。使用病原微生物或核酸模拟样本作为参考品时,应混入适量(参考临床水平)的人源基因组。
4. 精密性
对于定量检测试剂,建议考察试剂的标准差或变异系数;若为定性检测试剂,可不进行考察。建议从以下方面对NGS检测试剂的精密性进行评价:
4.1 对可能影响检测精密性的主要变量进行验证,还应对第二代测序仪、操作者及地点等因素进行相关的验证;
4.2 建议精密性评价方法考虑以下检测因素,包括检测周期、检测次数、检测方式(批内、批间)以及检测人员数量等;
4.3 若预期用途为检测人源基因,用于精密性评价的参考品建议覆盖低频率样本;若预期用途为检测病原微生物,用于精密性评价的参考品建议覆盖弱阳性样本。
5. 干扰物质
企业根据试剂盒所采用的样本类型,确定潜在的干扰物质,并进行充分验证。验证干扰物质时,建议验证的项目包括但不限于以下项目:
5.1 引物之间的互相干扰对检测结果的影响;
5.2 潜在的PCR干扰物质对检测结果的影响;
5.3 若预期用途为检测病原微生物,应分别检测目标病原微生物存在和不存在的情况下,非目标病原微生物(种属相近、临床症状相似)对检测结果的影响,以及人源基因组对检测结果的影响。
6. 其他问题
6.1 若产品适用的样本类型不止一种,应对所涉及的样本类型的适用性进行评估;
6.2 为保证检测结果的准确性,企业应根据不同测序平台的特性确定合适的测序覆盖度及深度,并进行充分验证;
6.3 生物信息学分析软件及数据库能直接影响检测结果,因此应明确版本信息或最后维护日期。企业进行软件或数据库升级后,应评估对测序结果的潜在影响,以及是否需要对既往测序结果重新分析;
6.4 对于适用多个仪器的产品,应提供所有适用型号仪器的性能评估资料。不同型号仪器配套的测序试剂可能不同,且测序试剂的性能直接影响检测试剂的整体质量,建议提供测序试剂的质量控制要求。
四、 起草单位
本指导原则由中国食品药品检定研究院医疗器械检定所体外诊断试剂二室起草完成。
五、 参考文献
2. 《中国生物制品规程》(2000年版),化学工业出版社。
3. Guidelines for Diagnostic Next-Generation Sequencing. European Journal of Human Genetics, 2015, 24(1):1584-1589。
4. Next-Generation Sequencing for Infectious Disease Diagnosis and Management: A Report of the Association for Molecular Pathology. The Journal of Molecular Diagnostics, 2015, 17(6):623-634。
5. ACMG Clinical Laboratory Standards for Next-Generation Sequencing. Genetics in Medicine, 2013, 15(9)。
6. College of American Pathologists' Laboratory Standards for Next-Generation Sequencing Clinical Tests. Archives of Pathology &Laboratory Medicine, 2014, 139(4)。
7. Molecular Diagnostic Methods for Infectious Diseases; Approved Guideline—Second Edition. Clinical and Laboratory Standards Institute. NCCLS, MM3-A2, Vol26 No.8, ISBN 1-56238-596-8。
8. Quantitative Molecular Methods for Infectious Diseases; Approved Guideline. NCCLS, MM6-A, Vol. 23 No.28. ISBN 1-56238-508-9。
9. Verification and Validation of Multiplex Nucleic Acid Assays; Approved Guideline. Clinical and Laboratory Standards Institute. NCCLS, MM17-A, Vol.28 No.9, ISBN 1-56238-661-1。
10. Translating Cancer Genomes and Transcriptomes for Precision Oncology. CA: A Cancer Journal for Clinicians, 2016, 66:75-88.
附录名词解释
1. 脱氧核糖核酸(DNA)
核酸的一种。是由特殊序列的脱氧核糖核苷酸单元(dNTP)构成的多聚核苷酸,起携带遗传信息的功能。DNA为一种双链分子,通过核苷酸碱基对间较弱的氢键维系。DNA包含的4中核苷酸包括:腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(G)。人类存在两种类型的DNA:来自细胞何种染色体的基因组DNA(gDNA)和线粒体DNA。
2. 核糖核酸(RNA)
核酸的一种。是与DNA类似的单链核酸,由核糖核苷酸按照一定的顺序排列而成,含尿嘧啶而不含胸腺嘧啶,存在于细胞质和细胞核中,在细胞的蛋白质的合成和其他化学活动中起重要的作用。RNA分子包含信使 RNA(mRNA)、转运RNA(tRNA)、核糖体RNA(rRNA)和其他小RNA等多种类型,分别行使不同的功能。各种RNA的混合物称为总RNA。
3. 富集(enrichment)
通过特定的方法使得混合细胞或核酸样本中待测核酸的比例增加,例如可以将不想检测的核酸成分选择性去除、或者对待测核酸成分进行选择性探针捕获或PCR扩增。
4. 测序文库(library)
将生物体的全部基因组核酸或部分核酸切割成一定长度的DNA片段形成的集合,可用于下游的扩增和测序。
5. 聚合酶链反应(polymerase chain reaction,PCR)
对特定的DNA片段进行体外酶促快速扩增的分子生物学技术,模拟DNA的自然复制过程。引物按照碱基配对与DNA模板互补结合以后,在DNA多聚酶的作用下,按照碱基配对的原则(A对T,C对G),从引物开始合成与模板DNA互补的DNA链。
6. 测序(sequencing)
分析特定核酸片段的碱基序列,也就是腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤的(G)排列方式。
7. 第二代测序(next generation sequencing,NGS)
又称大规模平行测序、高通量测序或深度测序等,指采用“边合成边测序”的原理(光学法和半导体芯片法)对于几十万到几百万核酸分子同时进行的测序反应,再通过生物信息学分析法得到的待测样本的核酸序列等信息的测序技术。
8. 靶向性测序(target sequencing)
对于特定的核酸区域,如特定基因、外显子等区域,进行靶向性测序检测。
9. 外显子组(exome)
某生物个体的基因组中蛋白质编码区域的全部外显子的组合。
10. 全外显子测序(whole exome sequencing,WES)
指对基因组中的全部蛋白质编码区的序列进行测序。
11. 全基因组测序(whole genome sequencing,WGS)
指对基因组全序列进行测序。
12. 比对(alignment)
指根据两个或多个的核苷酸序列的重合部分,来构建连续的核酸序列,或者据此找出序列结构变化的错配、插入、缺失及易位部分。
13. 测序覆盖度(sequencing coverage)
指测序获得的序列占整个基因组的比例。
14. 测序深度(sequencing depth)
指测序得到的总碱基数与待测基因组大小的比值。
15. 接头(adapter)
指用于偶联寡核苷酸片断的脱氧核苷酸短片段。
16. 条码(barcode)或标签(index)
指一段特征性的脱氧核苷酸短片段;在多样本混合检测时,充当一个识别特定样本来源的唯一标志。
|