及时准确的病因诊断是合理抗感染治疗的前提。病原宏基因组测序(mNGS)越来越多地用于临床实验室诊断复杂或不明原因的感染性疾病。已经有广泛的实验室开发的mNGS流程,并证明了它们检测病原体的能力。虽然mNGS的应用令人鼓舞,但其工作流程确实非常复杂,包括样品预处理、核酸提取、文库制备、测序、数据库建立、生物信息分析、结果解释和质量控制。每一步引入的可变性都会影响mNGS的性能。目前,所有现有的mNGS测试都是实验室开发的测试,并且越来越多的努力致力于推进mNGS的标准化。之前已经进行了几项环形比对试验和多中心研究,以评估当前临床mNGS工作流程。
近日,国家卫生健康委临床检验中心在杂志Clinical Chemistry上发表了一篇题为“Assessing the Quality of Metagenomic Next-Generation Sequencing for Pathogen Detection in Lower Respiratory Infections”的文章。临检中心在2022年启动了一项大规模的多中心研究,旨在评估基于DNA和RNA的mNGS方法在下呼吸道感染中检测病原体的效果。本研究致力于评估临床mNGS检测的整体性能,客观分析检测误差的来源,为促进mNGS质量保证发挥积极作用。
本次大规模多中心评估共有122家实验室参与,采用多种核酸提取试剂盒、测序平台、生物信息学管道建立实验室自主研发的mNGS检测方法。在这项研究中,临检中心准备了一个由14个样本组成的panel,包括23个具有代表性的呼吸道微生物,跨越5种不同类型(图A)。在122个实验室中观察到加权F1得分的显著变异性,范围从0.20到0.97,平均为0.86(图B)。表现的变异性主要是由于加权精度(平均= 0.94,范围:0.17-1.00),而加权召回率相对一致(平均= 0.82,范围:0.33-0.94)。73个实验室(59.84%)达到了1.0的加权精度,而没有一个实验室可以达到1.0的加权召回率。
研究中设计了两个相同的样品(S1和S2)来评估 mNGS测定的可重复性。36个实验室报告了237个再现性错误;近80%(188/237)的再现性错误来自于意想不到的微生物,其余来自于未检测到添加的微生物。
不同中心的mNGS性能概述。图片来源:Clinical Chemistry
除样本S8外(临床BALF基质),样本S1至样本S13用于评估参与者的假阳性结果。在1464个人工微生物添加样本中,共报告了784个物种的2082个意外结果(图C)。49个(40.16%)实验室报告了至少一个假阳性微生物,观察到的数量从1到大约800(图D)。共有21.31%(26/122)的实验室报告了1到5个假阳性微生物。在784个假阳性微生物中,出现频率最高的是铜绿假单胞菌(P. aeruginosa)、痤疮丙酸杆菌(Cutibacterium acnes)和奥斯陆莫拉菌(Moraxella osloensis),分别出现38次、33次和30次。
大多数假阳性序列(68.56%,399/582)能够成功地与报出的假阳性微生物匹配,这表明主要的假阳性微生物来自“湿实验室”流程。污染来源各不相同:一个实验室在12个样本中报告了11例急性呼吸综合征冠状病毒2,这可能源于实验室的环境污染; 4个独立实验室使用了相同的核酸提取和文库制备试剂盒,共报告嗜麦芽窄养单胞菌假阳性12例,可能是试剂污染所致。另有8个实验室不确定实验室污染的来源。
近三分之一的假阳性序列(31.44%,183/582)与报出的微生物不匹配。其中,73.77%(135/183)被错误归类为其他微生物,26.23%(48/183)与任何微生物序列不一致。近一半的错配序列(50.37%,68/135)与样品中添加的微生物重新匹配。其余错配序列(49.63%,67/ 135)随机匹配环境中常见或不常见的微生物。生物信息学错配导至的假阳性误差主要集中在少数实验室; 5个实验室占77.60%(142/183),其余41个(22.40%)的匹配错误来自18个实验室。
不同中心的假阳性来源。图片来源:Clinical Chemistry
当评估假阴性结果时,实验室被要求报告每个样品超过特定实验室设定阈值的所有微生物。没有实验室能准确检测12个样本中所有90种添加的微生物,浓度范围在1×102 - 1×106拷贝/毫升。观察到的假阴性结果范围从6到72种,几乎一半的实验室(39.34%,48/122)漏报了超过20种微生物(图B)。当微生物浓度≥104拷贝/毫升,假阴性结果主要来自RNA病毒;DNA病毒,真菌和细菌的检测能力更好。
经过作者分析,浓度≥104拷贝/毫升产生假阴性的主要原因是湿实验室流程导至微生物序列丢失。对于RNA病毒,湿法实验室期间微生物序列的丢失也是导至RNA病毒假阴性结果的最常见原因,近85%的假阴性结果在生物信息学分析前留下不超过3个reads(图C)。真菌和细菌的假阴性结果都倾向于在数据预处理和去除人类序列的过程中丢失微生物序列(图D)。
假阴性来源。图片来源:Clinical Chemistry
在相同宿主环境,不同微生物浓度的样品中,随着微生物负荷的增加,mNGS的召回率受到微生物浓度的显著影响(图A)。对于大多数微生物,假阴性率随着微生物浓度的增加而降低(图B)。在人类背景在2x105拷贝/毫升,大多数DNA和RNA病毒在效价高于104拷贝/毫升时,>80%的实验室能检测到;而>90%的实验室能检测到效价低于103拷贝/毫升的细菌和真菌。因此,检测病毒比检测其他微生物类型更具挑战性。
在具有相同微生物,但人类核酸10倍递增的样本中,高浓度的人类核酸降低了mNGS检测的召回率(图C)。相比细菌和真菌,RNA和DNA病毒的假阴性结果更容易受到高水平的人类核酸的影响(图D)。由于大量的人核酸占据了低丰度假阳性微生物的测序资源,因此mNGS检测的精度随着人核酸的增加而提高。12个模拟微生物群落样品中,S6样品假阳性菌数最多,其人核酸浓度最低; 而高人核酸样品S7的假阳性菌数最低。样品基质来源不同的S7和S8在召回率上存在显著差异。临床BALF样品(S8)的检出率下降可能是由于呼吸道样品中的复杂定植,因为mNGS的性能随着每个样品中微生物数量的增加而下降。
检测单个变量的性能。图片来源:Clinical Chemistry
设计了四个虚构的病例报告和相应的模拟微生物群落样本(样本S9-S12)来评估报告解释的性能。实验室需要结合mNGS结果、患者信息和临床微生物学知识,从检测到的微生物中确定潜在病原体。
样本S9为模拟铜绿假单胞菌与H1N1共感染样本,其报告正确率最低(图F)。绝大多数实验室(115/122,94.26%)能同时检测到铜绿假单胞菌和H1N1;但仅有55.74%(68/ 122)的实验室能准确报告混合感染性致病菌。样本S10、S11和S12为模拟单病原体感染样本(图G)。样本S10中,73.77%(90/122)的实验室能准确报告人正肺病毒,报告的主要错误类型为人正肺病毒和其他病原体(16.39%,20/122)。75.41%(92/ 122)的实验室能准确报告S11样品为HAdV感染,报告的主要错误类型为“HAdV和其他病原体”(18.85%,23/ 122)。88.52%(108/122)的实验室能准确报告S12样本的新型隐球菌感染。报告的主要错误类型为“新型隐球菌和其他病原体”,只有一个实验室缺失了此病原体。10.66% ~ 38.52%的实验室能够检测到目标病原体,但未能达到正确的病因诊断。
这是最大规模的多中心研究,使用模拟微生物群落和真实临床样本来评估122个mNGS实验室的性能。本研究介绍了假阳性和假阴性结果的来源,并评估了mNGS结果的解释性能。在mNGS测试中仍然存在许多挑战,首先是污染问题。本研究揭示了从湿实验室(68.56%)到干实验室(31.27%)的不同污染源。湿实验室的污染核酸可能来源于样品采集和制备过程,如人体菌群、实验室试剂、耗材或环境菌群。建议建立一个来自正常菌群或实验室污染的背景微生物数据库,用于长期监测。交叉污染也是湿实验室的另一个重要来源。错误分类可能是由于数据库包含错误注释的参考序列。建议在mNGS方法建立后,先对生物信息管道进行验证。
假阴性结果主要是由于湿实验室程序,微生物浓度是影响假阴性结果的最关键因素。mNGS应明确各种类型病原体的检测限,以提醒诊所低于此浓度的微生物不太可能被检测到。临床样本中大量人类核酸的存在极大地影响了mNGS分析的召回率。去人源方案延长了分析时间,增加了弱壁或无壁微生物丢失的风险,在应用之前应充分评估。RNA病毒基因组较小,易于降解,需要逆转录,这些都给RNA病毒的检测带来了挑战。因此,强烈建议在建立mNGS方法时,多注意RNA病毒的检测。
此外,物种分类工具的选择是精度和召回率之间的权衡,高召回率通常会牺牲精度。实验室应根据临床目的采用合适的分类学工具和参数。
对临床mNGS结果的可靠解释需要广泛的专业知识,并主张建立由传染病专家、实验室医学专家和生物信息学专家组成的“临床微生物测序委员会”。