传统的短读长全外显子测序(WES)技术,通常只聚焦于蛋白质编码区(CDS)的检测。然而,像深内含子变异或结构变异(SVs)这类关键的基因组变化,往往需要依赖更全面的全基因组测序(WGS)才能准确识别。虽然目前已知的致病变异中,约95%都位于CDS区域内,但仍有部分与疾病相关的变异隐藏在WES技术难以覆盖的“盲区”——例如线粒体DNA或高度重复的序列区域。WGS虽然能提供更完整的基因组覆盖,但其成本通常是WES的两倍以上,这一高昂费用严重限制了其在临床中的大规模应用。 近日,杂志Journal of Human Genetics上发表了一篇题为“Augmenting cost-effectiveness in clinical diagnosis using extended whole-exome sequencing: SNVs, SVs, and beyond”的文章。作者通过扩展WES的靶向检测范围,使其不仅覆盖CDS区域,还能包括内含子、非翻译区(UTR)、重复序列以及线粒体基因组。这种改良后的方法,能够在接近传统WES成本的前提下,显著提升诊断率,为临床遗传学提供更高效且经济的解决方案。 图片来源:Journal of Human Genetics 主要内容 扩展WES捕获探针的设计及不同探针的混合比例 作者设计了一套扩展的定制捕获探针,以瞄准传统WES未充分覆盖的基因组区域。扩展的区域包括覆盖日本医保覆盖的188种罕见病基因的内含子及UTR;纳入ACMG SF v3.2推荐的81个次要发现基因;靶向70个与疾病相关的重复序列区域;全长线粒体基因组。除此之外,作者评估了上述目标的最佳探针混合比例。通过实验验证,内含子/UTR探针浓度设为标准WES的25%,重复序列区域为100%,线粒体探针为2.5%,以平衡覆盖深度与成本(如下图)。 扩展WES设计中目标区域的组成。 图片来源:Journal of Human Genetics 评估扩展WES覆盖度 作者采用标准基因组DNA样本HG001和HG002,对标准WES和扩展WES的覆盖率进行了比较。结果显示,扩展WES在CDS区域的平均覆盖深度比标准WES仅降低10.0%(图A、B)。对于内含子和UTR,相比标准WES大部分未被检测到,扩展WES深度≥10的覆盖率也能达到85%以上(图C-F)。在70个重复区中,约50%可被WES的覆盖,扩展WES的覆盖率增加到85%以上(图G, H)。对于线粒体DNA,扩展WES覆盖率轻易可达到100%(图I, J)。 标准和扩展 WES 在不同基因组区域的覆盖深度分布情况。 图片来源:Journal of Human Genetics 扩展WES对致病变异的检测 最后,作者利用已知携带致病性SV和SNV的样本评估了扩展WES对致病变异的检测。结果显示,扩展WES成功检出了CHD7基因10.5 kb杂合缺失(图A)、CREBBP基因14.5 kb缺失(图B)及MTM1基因9.3 kb纯合缺失(图C)。作者还在一个样本中成功鉴定出线粒体m.3243 a > G变异,其异质性约为37%(图D),与数字PCR结果高度一致。此外,DMPK基因重复扩增通过扩展WES检出,经纳米孔长读长测序验证为1500-8500 bp CAG重复。 通过扩展WES检测到的致病性变异。 图片来源:Journal of Human Genetics 结果与讨论 在这项研究中,作者通过扩展WES的靶向检测范围,使其不仅覆盖CDS区域,还能包括内含子、非翻译区(UTR)、重复序列以及线粒体基因组。这种改良后的方法,能够在接近传统WES成本的前提下,显著提升诊断率,为临床遗传学提供更高效且经济的解决方案。扩展WES成本约为传统WES的1.2倍,远低于WGS,且数据存储与分析负担更低。通过选择性扩展临床相关基因的非编码区,避免了全基因组靶向的冗余。 总之,通过将WES扩展到包括选定基因的内含子和UTR、重复扩增位点和线粒体基因组,可提高诊断率并缩短周转时间。通过相应地更新探针设计,这种方法可以很容易地适应基因面板或公共保险计划下疾病覆盖范围的未来变化。希望这一策略将被用于研究和临床环境,并最终通过更有效的基因诊断使患者受益。 |