关于长读长测序与传统NGS短读长测序的一个争论就在于,短读长测序非常适用于短片段DNA如细胞外游离DNA(cfDNA,包括ctDNA),因为妊娠期cfDNA的大小约为166bp,而常用的Illumina测序平台推荐的插入片段大小通常为200-500bp。因此关于cfDNA所发表工作也鲜有大于500bp的片段,因为使用短读长测序技术来检测500bp以上的长片段DNA是比较有挑战的。似乎,关于NIPT和ctDNA液体活检这两个大的应用上,长读长测序很难与短读长竞争。然而不然,如果母亲血浆中的cfDNA有相当比例的长片段DNA呢,如何这些长片段cfDNA也能很好的被开发作为特定生理/病理的生物标记物呢? 前两天,香港中文大学的卢煜明院士团队就在PNAS上见刊了一篇文章——单分子测序揭示了母体血浆中大量的长片段细胞外游离 DNA 分子。使用他们团队最近开发的长读长甲基化测序技术,发现母体血浆中非典型的长片段cfDNA 分子可能为诊断胎儿单基因病和母体妊娠并发症提供新思路。卢院士真可谓是为长读长应用于产前无创诊断领域开了个好头。
这项研究证实了PacBio SMRT测序能够检测到母体血浆中来自胎儿和母体的大部分长cfDNA 分子。这些分子远远超出了短读长测序所能检出的片段大小。在妊娠早期、中期和晚期,母体血浆中超过 500 bp 的长cfDNA 分子的比例分别为 15.5%、19.8% 和 32.3%,而观察到的最长的胎儿血浆 DNA 分子达到了 23,635 bp。
整片文章的思路很有卢院士工作的风格,除了确定了来自不同妊娠期的血浆样本中长cfDNA 分子的丰度,文章还通过分析它们的末端基序谱(motif)来表征短 DNA 分子和长 DNA 分子。对来自先兆子痫妊娠的血浆 DNA 样本进行了片段大小和末端基序分析,以探索寻找这种妊娠相关疾病的潜在生物标志物。最后,通过甲基化分析以确定甲基化模式(即单个血浆 DNA 分子的所有 CpG 位点中甲基化 [M] 和未甲基化 [U] 胞嘧啶的顺序),探索根据甲基化模式来推断单个血浆 DNA 分子的起源组织,应用这种母体血浆 DNA 的单分子组织来源分析方法判断胎儿的母体遗传。
这篇文章也把大家的关注点聚焦到了单基因病的无创诊断上,当然文章所涉及的样本数量有限,更像是一个概念证明,也需要在更大的样本队列中进一步验证这一方法在单基因病产前检测的应用。但值得注意的是,文章所涉及的方法已经申请专利并授权给了卢院士的分拆公司Take2,这家公司除了推动鼻咽癌的早期筛查开发和商业化之外,可能也会重点关注单基因病NIPD。 NIPT的使用现在已经比较普遍,但很大程度上仍仅限于广泛适用的染色体疾病,及针对已知单基因疾病携带者家庭的特异性检测。然而,诊断胎儿的新发致病突变自cfDNA技术发展伊始就被抱有很高期待。卢院士团队从早期NIPT开始就关注无创的单基因病诊断,开发了不同版本的基于单倍型剂量分析的方法,但测序的高深度所带来的高成本限制了其广泛使用。
采用标准短读长测序进行无创单基因病检测的商业化成熟产品代表就是 Baylor Genetics 的 PreSeek,它也由 Natera 以 Vistara 的名义销售,这是一种显性疾病的单基因筛查检测。Baylor 和 Natera 的研究人员在2019年报告了 422 次妊娠的队列,其中PreSeek检测确定了所有阳性结果,并且对于那些可获得后续随访信息的病例也没有提供假阳性或假阴性结果。即便如此,对于常染色体隐性遗传疾病,无创产前检测还需要进一步开发,扩大其工具库。这篇文章则提示母体血浆中的长片段cfDNA 将提供实现这一目标的不同路径。 卢院士和他的团队先前开发了一种方法,通过PacBio SMRT 测序检测 DNA 胞嘧啶甲基化,他们称之为整体动力学 (HK) 模型(holistic kinetic model,香港模型?)。生物样品中大多数cfDNA 分子的长度通常小于 200 bp,而SNP 或 CpG 位点与其最近的 SNP 或 CpG 位点相隔数百或数千个碱基对。因此,在短的cfDNA 分子上发现两个或多个连续 SNP 或 CpG 位点的可能性很低,而长 DNA 分子可能包含多个 SNP 和CpG 位点。因而通过单分子水平分析长DNA片段的一个优势就是可以获得更多的遗传和表观遗传信息。沿着长 DNA 分子上的一系列 CpG 位点的甲基化模式,就可以确定其胎儿或母体的组织来源,能够直接比较相应母体和胎儿 DNA 序列中的单核苷酸多态性/遗传模式,从而进行产前诊断。
作者也提到,除了技术验证和优化之外,应用的另一个限制就是目前 Pacbio测序的通量相对较低,立即进行临床实施的成本挑战很大。但既然卢院士的工作已经证明了存在大量以前未曾探索过的长 cfDNA 分子,这可能将激发长读长开发商持续创新以降低测序成本。(当然以上这些都适用于ONT,毕竟挖掘长cfDNA宝矿可能不会局限于某种特定的工具。) 当然,作为产前cfDNA研究的诺奖级人物,卢院士的工作并不局限在cfDNA的片段大小上,他的团队之前还发表了关于片段“锯齿化jaggedness”和环化的模式,包括片段化特征fragmenomics等,都可能被用作开发相应的生物标记物。因此对于商业化、临床应用可能都会保持开放的态度,不会押宝某一项特定指标。
长读长测序应用于产前诊断的大门已经被打开了,单基因病NIPD也是愈发可热的方向,适逢PacBio和ONT都快马加鞭铺垫市场的当下,对此你有什么感想?
欢迎评论或者私信,反馈或者指教。 详细信息请参阅以下文献:
|