立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索
小桔灯网 门户 资讯中心 专栏文章 动力彩虹 查看内容

单分子突变测序SMM-seq,对低丰度突变的定量检测!

2022-5-17 14:13| 编辑: 归去来兮| 查看: 1289| 评论: 0|来源: 小桔灯网 | 作者:动力彩虹

摘要: 正如研究团队所证明的,SMM-seq能够检测正常人体细胞和组织中诱导的和自然发生的体细胞SNV。


多细胞生物体细胞基因组的突变是DNA修复或复制过程中错误的必然结果。体细胞突变导至癌症,并与其他病理学有关。过去,人们曾试图开发定量分析细胞和组织中各种类型突变的分析方法。鉴于DNA测序的显著进展,人们会认为在人类或动物细胞和组织中,体细胞突变应该很容易定量检测。在很短的时间内,关于人类肿瘤体细胞突变的大量信息已经变得可用。然而,肿瘤是克隆谱系,在肿瘤的单个细胞之间共享许多突变。然而,正常组织中的突变对于每个细胞来说都是唯一的,通过测序来检测它们仍然是一个挑战,因为体细胞突变发生的丰度很低,并且通过测序时读取传播,与测序错误无法区分。克服这个问题的一种方法是使用基于单细胞的方法。然而,尽管单细胞方法是目前唯一一种允许对体细胞突变负荷进行全基因组全面评估的方法,但这种方法耗费资源和时间,价格昂贵,限制了其广泛应用。另一种方法是双链测序(duplex Seq),它基于互补DNA链的比较分析,可以准确定量地识别大量DNA中的超罕见体细胞单核苷酸变体(SNV)。虽然在技术上比单细胞测序要求更低,但Duplex-Seq抑制错误的能力仅限于一条链上错误概率的平方。


近日,来自于美国、俄罗斯、中国的研究团队在杂志SCIENCE ADVANCES上发表了一篇题为“Single-molecule, quantitative detection of low-abundance somatic mutations by high-throughput sequencing”的文章,在这篇文章中,研究团队介绍了单分子突变测序(SMM-seq),这项技术可以准确、经济高效地评估从正常细胞和组织提取的大量DNA中的体细胞SNV。


图片来源:Science Advances


主要内容

SMM-seq建库

SMM seq的关键特性是两步建库方法。首先,基于滚环扩增法(RCA)用于产生单链DNA分子,由每个特定DNA片段的多个相同DNA链的联合拷贝组成。使用具有强链置换活性的人工耐热聚合酶进行扩增。这允许进行多次变性退火延伸,以确保在称为pulse-RCA的反应中进行有效且无偏倚的放大。因为所有这些拷贝都是原始DNA片段的独立复制品,所以每个拷贝的潜在扩增错误都是唯一的,不会进一步传播。相反链的拷贝以端到端的方向排列,并在该过程的第二步中被用作聚合酶链反应(PCR)启动位点的公共间隔子分离,此时,将共聚合拷贝单独扩增并转化为测序文库。因此,由此产生的测序文库由在滚环(RC)扩增子中组装的原始DNA片段的多个独立拷贝的PCR副本组成。


SMM-seq工作流程概述

图片来源:Science Advances


SMM seq数据分析和确定真突变的算法概述

来自同一片段的测序读取基于在文库制备过程中作为发夹状adapter的一部分引入的唯一分子标识符(UMI)进行识别。然后,由来自原始片段的两条链的读码组成的UMI家族被用来识别每个片段的一致序列。参考基因组上相应位置不同位点信息与该特定DNA样本的单核苷酸多态性(SNP)列表以及SNP数据库(dbSNP)进行比较。这允许筛选出种系变体,并识别潜在的de novo体细胞突变。通过分析与SMM-seq并行进行的同一DNA样本的常规测序数据,获得了种系SNP列表。最终的潜在体细胞SNV列表被进一步过滤以排除低置信度候选,然后保存以供进一步分析。


SMM-seq检测到的每个变异都属于以下类别之一:真阳性(TP)或假阳性(FP)。为了确定最佳分析参数,研究团队对每步的分析参数进行了优化,最后确定了如下图所示的算法可以最大程度上区分真突变和扩增引入的测序错误。


SMM-seq确定真突变的算法概述

图片来源:Science Advances


用SMM-seq检测ENS诱发的SNV

作为原理证明,研究团队首先对从体外接受两种不同剂量的N-乙基-N-亚硝基脲(ENS)处理的正常人IMR90成纤维细胞中提取的DNA进行SMM-seq分析,ENS是一种有效的点诱变剂。在这里,研究团队使用亚致死剂量的ENU,不会在IMR90细胞上造成任何明显的细胞死亡。对SMM-seq数据的分析显示,每个样本基因组平均约有2亿个位置符合SNV识别条件,即约占基因组7%。从IMR90 DNA中制备常规测序文库,测序,并与SMM-seq并行分析,以获得IMR90特异性种系SNP列表。结果显示,SMM-seq分析允许在所有测试条件下检测ENU的诱变效应。ENU的最低剂量(25 ug/ml)使IMR90细胞的突变频率从0.21±0.02增加到0.36±0.04 SNV/1 Mbp(P=0.005),而ENU在50 ug/ml导至突变频率增加两倍以上(0.54±0.03 SNV/1 Mbp;P=9.7×10−5).


研究团队还测试了对照组、未处理细胞和接受ENU处理的细胞中体细胞SNV的突变谱。结果显示ENU处理后突变谱发生明显变化,TA/AT和TA/CG突变的相对表达[特定于ENU]>比未处理对照细胞大2倍。因此,SMMseq能够检测由低剂量诱变剂诱导的体细胞SNV。


诱导体细胞SNV的定量检测

图片来源:Science Advances


用SMM-seq检测与衰老相关的SNV

研究团队测试了SMM-seq是否能够检测衰老过程中积累的人体组织中的生理突变负担。研究团队利用了最近发表的关于人类肝脏中年龄相关突变负荷的研究,该研究采用基于金标准单细胞的方法进行,并使用SMM-seq分析法重新分析了相同的样本。研究团队使用同一研究中每个参与者的大量DNA的全基因组序列来减去种系SNPs。SMM-seq文库是从三名年轻人(5个月、16个月和18岁)和三名老年人(56、61和77岁)的肝组织提取的DNA样本中制备的。本实验中对SMM-seq数据的分析显示,每个样本基因组平均约有7.7亿个位置符合识别SNV条件,相当于样本基因组的约26%。SMM-seq证实了通过单细胞方法观察到的体细胞突变频率的年龄相关升高。SMM-seq检测的突变频率在年轻组和老年组中分别为0.34±0.09和0.96±0.16体细胞SNV/1 Mbp(P=0.003)。体细胞SNV谱分析显示,老年人肝脏DNA中TA到CG突变的相对代表性几乎增加了两倍(年轻人为16.2%,老年人为29.1%),类似于单细胞方法观察到的情况。


正常人肝脏中体细胞SNV的定量检测。

图片来源:Science Advances


使用SMM-seq数据评估突变特征

为了进一步了解老年人肝脏的突变谱,研究团队从六个分析样本的突变谱中提取了两个从头突变特征S1和S2(图3C)。发现老年组的特征S1显著增加(P=0.0134),并与衰老特征SBS5相关(余弦相似性:0.904,置换试验P<0.001)。信号S2在年轻组中占主导地位,有大量CG-TA转换和TA-AT转换,但信号S2的来源尚不清楚,没有发现信号S2和已知的COSMIC(癌症体细胞突变目录)信号之间有任何实质性的相似性。这些特征分析结果,以及我们关于与年龄相关的突变负荷增加的结果,与之前的发现非常一致。因此,SMM-seq能够在生理条件下检测正常人体组织中积累的体细胞SNV。


衰老相关肝脏突变谱的特征。

图片来源:Science Advances


总结与讨论

使用双链共识测序识别罕见突变的各种方法,即Duplex-Seq、BotsEq和NanoSeq,都是基于对两条相反DNA链的分析,以消除潜在错误。这些方法的错误率由两条链中两个互补错误的概率决定,可以定义为P(E)2,其中P(E)是两条链中任何一条的错误概率。SMM seq不仅限于两条链,因为它使用来自每条链的多个独立副本的测序数据进行变体调用。相反,SMM seq的错误率可以计算为P(E)N,其中N是线性放大步骤中产生的独立拷贝数,检测到的突变频率在家族大小为7的情况下趋于稳定。


正如研究团队所证明的,SMM-seq能够检测正常人体细胞和组织中诱导的和自然发生的体细胞SNV。SMM-seq结果与使用基于单细胞的方法获得的结果一致,该方法目前是该领域的金标准。然而,SMM-seq的使用对资源的要求要低得多。SMM-seq比基于双链seq的方法更准确,因为原始DNA片段存在多个独立副本。因此,SMM-seq是一种实用的方法,是一种定量鉴定正常细胞和组织中点突变的新方法, 非常适合于大规模人类研究中基因组完整性的综合评估。


声明:
1、凡本网注明“来源:小桔灯网”的所有作品,均为本网合法拥有版权或有权使用的作品,转载需联系授权。
2、凡本网注明“来源:XXX(非小桔灯网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有,如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

鲜花

握手

雷人

路过

鸡蛋

最新评论

关闭

官方推荐 上一条 /3 下一条

客服中心 搜索 官方QQ群 洽谈合作
返回顶部