金桔
金币
威望
贡献
回帖0
精华
在线时间 小时
|
题记:不同的技术有不同的利弊,正如选择高铁意味着快速与普通价格,选择飞机意味着飞速与高价,选择自驾可能意味着堵车风险与疲倦却伴随乐趣。不同的技术,有不同的天花板。那么在液态活检领域使用的技术都有哪些?它们的基本原理是什么?它们的技术极限又是什么?本篇文章着力于解决这个问题。
液态活检技术有哪些?
这个问题从以下几个方面讲:1,首先复习一下液态活检对象主要包括:ctDNA,CTC与外泌体。2,我们进行检测的目的无非是通过分离提取它们,然后通过分析(计数/基因突变信息/浓度)对象特征提供给临床有意义的信息。3,下面分别说明这以这三种对象为基础的技术。ctDNA:第一种思路是分析者预期某特定患者(如非小细胞肺癌)的某个特定基因(如EGFR)的某个特定位点(如L858R特定突变)会发生突变,那么只需要判断该患者的ctDNA是否发生该突变就可以了,其它的位点不需要管,这种类型的方法PCR类型方法;第二种思路是分析者预期患者的肿瘤细胞DNA许多驱动基因都可能发生突变,而且许多位点也有可能发生突变,这时候分析者就选择直接对肿瘤细胞DNA测序,然后将肿瘤患者DNA序列与正常细胞DNA序列对比,这样就能发现肿瘤细胞的DNA到底是什么地方出问题了,这种类型的方法称为测序类方法。CTC:分析CTC主要有两个难点,几十亿个细胞只有几个细胞是CTC,难富集与分离,富集分离后需要准确判断该细胞是否为真正的CTC,难鉴定。因此,对CTC的分析就主要分为两个步骤:富集(分离)与鉴定。富集无非就根据CTC与正常细胞的特征差异来进行操作,分为免疫亲合法与物理特性富集法两类;鉴定无法也是根据它与正常细胞特征差异,只是用的原理或者方法较富集的时候更加精细,分为:免疫荧光、荧光原位杂交、基于PCR的检测方法、高通量单细胞测序。例如:免疫荧光法中认为EpCAM +、CK +、DAPI+、CD45 -的细胞为CTC,而EpCAM+、CK +、DAPI+、CD45 +的细胞不为CTC。Exosomes (外泌体):涉及到外泌体的方法主要还是在提取,研究者根据外泌体的特性多采用超速离心、磁珠免疫捕获、沉淀或过滤的方法,对exosome进行前期的分离。之后利用电镜来分析其大小和形态,利用流式细胞仪来分析细胞表面标记,通过Western blot和ELISA等方法对蛋白进行分析,或通过qPCR和新一代测序(NGS)来分析RNA。
第一代测序方法是什么?
在讲这个问题之前,这里先普及一下DNA的基本组成。DNA的基本结构单元是脱氧核糖核苷酸:一分子含氮碱基(ATCG) + 一分子五碳糖(脱氧核糖)+ 一分子磷酸根。DNA双螺旋结果中,含氮碱基在内测进行配对,五碳糖和磷酸在外侧相互链接并与下一个单元结合形成双螺旋构架。这个五碳糖有三个接头:一个接头用于本单元的连接碱基,另一个接头用于连接本单元的磷酸基,第三个接头用于连接相邻基本单元的磷酸。我们经常所说的测序其实是测碱基(ATCG),因为五碳糖和磷酸基大家都一样有什么好测的,正是这些ATCG的顺序和不同的排列组合才是关键所在。下面开始正式讲第一代测序了,从以下几个方面讲:1,现在说的第一代测序基本上就指Sanger测序了,这是由1977年英国科学家Sanger发明的,该种方法至今被认为是金标准,如果对其他方法做的结果有疑虑,那么请用该方法再做一次验证就好了,古老而传统,可是却无比准确,这就是距今40年却未衰之理由。2,在DNA复制过程中掺入ddNTP(分别加入ddATP, ddTTP, ddCTP, ddGTP),就会产生一系列随机终止的DNA链,这些链能通过电泳按长度分辨出来,(不同末端终止DNA链的长度是由掺入到新合成链上随机位置的ddNTP决定的),在电泳条带上便可读出DNA的序列。这种方法叫做Sanger测序法。3,其实我看了第二条也不大明白这是什么意思,因为有时候真的需要一两句话概况某种技术,可是概况的坏处就是不容易让人理解。举个例子:假设一个离心管内装着10M条长度为1000bp的未知序列的DNA片段,首先分别加入足够量的原料(dATP, dTTP, dCTP, dGTP)、引物及酶,此外加入特殊处理的原料/核苷酸(第一次反应我们只加ddATP),这个ddATP其实就是脱氧核糖核苷酸(DNA的基本单元),只是它和普通的脱氧核糖核苷酸不同,它的五碳糖(一共有三个接头)的第三个接头由原本的羟基变为了孤独的氢,不能连接下一个脱氧核糖核苷酸的磷酸基了,那么合成就完全没办法继续进行下去了。由于这个ddATP和dATP长得非常像,所以它也可以骗过体内的酶把它合成上去,只是它一上去就把整个合成终止了。1000bp的DNA片段,我们假设前10个序列为ACGTCGGATCC,那么由碱基互补配对原则前三位合成的是TGC,这个完全没有问题,离心管内早就加入了足够的原料;最关键的事情来了第四个碱基配对的是dATP还是ddATP呢?在离心管内这是随机发生的,应该说由于只有少量的ddATP大概率事件这个是加入的dATP,可是这里有10M个这样的DNA片段啊,总有一条是加入的ddATP,此时分为两个路线了:1)加入的是dATP,这条链继续延伸至第7个碱基,然后出现上述的两种随机选择;2)加入的是ddATP,这条链就终止了。就这样我们得到了以下长度的片段:ACGT(TGCA),ACGTCGGAT(TGCAGCCTA);这些片段共同的特征是以A结尾。我们再将得到的片段在毛细管电泳上跑一跑,它们就会按照长度排成一列,由于这个毛细管电泳分辨度非常高(一个碱基的差异也能分辨出来),这样我们就可以知道哪些位置是碱基A,这1000bp的DNA片段,我们得到第4、9、21、24...位置是A,然后互补的原链这些位置就是T。第二次反应我们只加ddCTP,第三次、第四次,这样我们就可以将序列全部测出来了。4,基本原理与过程就是上面这样,实际应用过程中有许多优化,例如将四个ddNTP(每一类ddNTP带有不同荧光)一起放进去同时反应,检测仪器通过不同荧光去辨别不同类型的碱基。5,Sanger测序仪的代表为Thermo Fisher公司的ABI 3730XL,原始数据的准确率高达 99.999%,敏感性仅为20%,成本为0.5美元/Kb (即测定1000个碱基需要0.5美元,人类基因组30亿个碱基),一次性可以上96个样品,一天可以跑12次。
第二代测序比第一代测序先进在哪里?什么又是下一代测序,NGS又是什么?
Sanger测序法确实厉害,被用于“人类基因组计划”(HGP)。这个了不起的计划从1990年启动至2003年完成总计13年,耗费30亿美元。时间太长、耗费太高是主要问题。所有人都期待一种方法:快速钱少且准确。在此背景下,第二代测序技术(下一代测序技术,边合成边测序技术,NGS)应运而生。1,Roche 454 (罗氏公司收购454 Life Sciences公司)、Illumina Solexa (Illumina 公司收购Solexa公司)、Thermo Fisher公司的ABI Solid、华大基因公司的Complete Genomics (华大CG)、Thermo Fisher公司的 Ion Torrent。主流为:Illumina Solexa(科研较好)和Ion Torrent(临床较好)。停止技术服务:Roche 454 和 ABI Solid。2,NGS区别第一代测序技术主要为:合成后测序->边合成边测序;读长较短;一次并行测几十万到几百万条DNA分子。
3,先来聊聊Ion Torrent(以后我准备谈到Ion Torrent,脑海里浮现三个词:乳液PCR、磁珠与PH),读取长度为 ~200bp,通量(读取长度*微孔数量)为~10G,微孔数量(磁珠数量)为10~80million,单次上机测序(上机前还有一些准备工作)时间为2~4小时,仪器有PGM、Proton、S5三种;Ion Torrent的优势是速度快,处理量比较适中;劣势:重复碱基测的没那么准确,整体准确率为99.97%。过程:1)将目标DNA打成几百万个小片段,接上接头,即制备测序文库(4小时);2)通过浓度控制,这些几百万个小片段DNA分别接到纳米级别的珠子(就是物理的珠子)上,一个珠子只结合一个DNA(ssDNA,单链DNA)片段,然后进行(油包水)PCR;3)洗掉没有结合DNA(无PCR)的空珠子,留下富集已PCR好的磁珠。4)将一个个磁珠点到芯片上一个个微孔(几十万、几百万、几千万个微孔,1000万为例)里(一个微孔只装下一个磁珠),这个装着磁珠(每一个磁珠上带着DNA序列一模一样的长度约200bp的DNA片段,约100万个拷贝)的微孔就形成了一个反应池。5)现在我们开始测序:一盆dATP倒进去,假如1000万个磁珠中有200万个磁珠这个位置上序列为T,那么dATP就结合上去了,这一结合形成磷酸二酯键的同时必然放出一个H+,那么这个H+就会引起这200万个磁珠微孔发生PH变化,这一PH变化马上会被检测到且将化学信息转变为数字电子信息,每个碱基的检测只需要几秒。1000万个中余下的800万个磁珠dATP上不去,就检测不到信号了;没关系,将dATP全部清洗掉,我们再倒一盆dGTP去,此时和上面发生的情况就大同小异了。6)应该说有些微孔的序列先测完,有的微孔的序列后测完。7)如果某个磁珠上的某处序列为TTT,那么dATP上去会放出3个H+,那么最终数字信号也会强一些。
4,分段写了,感觉这个还是按照以前的格式,这一段就没有人有欲望读下去了。再来聊一聊Illumina(以后谈到Illumina,脑海里浮现三个词:桥式扩增、可逆阻断、荧光),它应该说是二代测序的代表,市场占有率杠杠的。Illumina测序仪的读取长度为150bp(*2,两端一起就可以读长为300bp),一次的通量为15G ~ 1.8T(不同仪器跨度真大),运行时间:5小时~6天,比Ion Torrent长多了;仪器有:MiSeq, NextSeq和HiSeq系列。过程:1)DNA待测文库构建:利用超声波将待测DNA样本打断成200-500bp的小片段,然后我们再筛选出150bp~200bp的片段(这个范围可以稍微调整,但是必须在可以检测的范围内,将大片段扔了公司技术人员说不会影响覆盖度的)并在这些小片段的两端接上不同的接头(一个接头长约60bp);除了加上接头我们还会加一个Barcode(一小片段DNA)以识别到底是哪个样本(例如加上ATATAT就代表花花这个病人,加上CGCGCG就代表明明这个病人,最终得到的文库其实是很多病人的混合DNA,到时候通过这个Barcode去重新识别谁是谁);构建出单链DNA文库;数目不够,PCR一下它们就可以了;这里有一个问题,这样得到的文库包含了待测DNA样本的所有片段,我们只想测某一些特定区域的DNA片段的序列呢?怎么办?在这个阶段先把靶DNA们挑选出来,这就涉及到序列捕获系统;目前目标序列捕获方法为3种:NimbleGen Sequence Capture array、Agilent SureSelect DNA Capture Array 、Agilent SureSelect Target Enrichment System;这个过程非常精细也比较复杂,捕获技术怎么样直接影响后续的结果与分析。2)Flowcell介绍:有一个像载玻片的东西这里叫做Flowcell(长方形),它上面平行于长边依次有8个channel(泳道),每个channel其实就像小时候四驱车 (一种玩具车)的跑道一样(笔直平坦的路,路两侧竖直的隔板),在这条channel上密密麻麻地种植(化学键固定,抹不掉的)着长为60bp的DNA片段(一个叫P5,一个叫叫P7,它们可以分别和文库构建时加的两个接头互补配对),这个种植的DNA片段整个Flowcell大概有2500万~30亿个,很多。3)簇生存:文库建好了(很可能是几个、几十个样本混合的长度为150bp~300bp的带有接头的DNA片段),一盆倒在Flowcell上,这些片段DNA就随机的在Flowcell的channel上找位置定居下来;其中一条DNA片段的接头P5就和channel上的“P5”配对,然后此时的种植的“P5序列”就类似引物的作用可以引导延伸;等到延伸至终点位置,得到完全和待测DNA片段一样长(互补配对的)的配对DNA链,此时就把待测DNA片段洗掉(抛弃它);配对DNA链“弯个腰”,它的P7端就和种植的“P7” DNA互补配对,此时种植的P7端又相当于引物,一直延伸链至终点;此时再将这对DNA链分开,那么就形成了一端为种植P7的DNA链,一端为种植P5的DNA链,它两为互补配对链;接下来,这两条DNA链再次“弯腰”(桥式扩增),就可以重复以上过程了,总共进行28次循环过程,形成了5000~10000个拷贝(信号放大了,可以检测到强度);这时候还要做一个动作,因为你形成了许许多多互补的链,至少有一种链对我没有意义,于是就切割冲掉一类链,最终只剩下一类链;这个时候Flowcell上的channel就很壮观了,随机分布着各种簇,每一个簇约10000个待测DNA拷贝(它们离得特别近);这时候还做一个处理,簇的顶端把羟基给封住,不让你有可能再有其他意外。4)测序:现在可以进行第四步了,面对着这些成千上万的簇,我们现在的任务就是把这些簇的序列给测出来。一盆dNTP(第一个处理:五碳糖上的第三个接头的羟基被阻断;第二个处理:碱基上挂一个荧光基团,AGCT不同的荧光)和引物倒进去,这些dNTP就随机地游到这些成千上万的簇那里,引物早早在那里等它;这成千上万个簇的引物下第一个碱基无法就是ATCG,那么与之配对待接上去的无非就是TAGC,此时这些簇总有一个脱氧核糖核苷酸会挂上去;一旦挂上去,后面的碱基是来不了的,因为五碳糖上的第三个接头的羟基被阻断了,此时挂上去的脱氧核糖核苷酸会发光(ATCG分别发出不同的颜色的光),我们对每个簇都拍个照,如果坐标为(34,35)这个簇发红光,我们就认为是A挂上去了,如果坐标(345,907)这个簇发绿光,我们就认为是T挂上去了;所有的簇都发完光了,我就把所有待测DNA的第一个碱基全测出来了,此时再把五碳糖上的第三个接头的羟基Free了,并把这个刚上去的脱氧核糖核苷酸的碱基上的荧光基团冲走;接着干,不过此时就和上面过程一样了,循环做个100多次就测完了。我们最终得到的数据其实是:带有Barcode、接头、待测DNA片段的约200个碱基的序列。
5,写到这里,或许你还想知道其他NGS的技术细节又是怎么弄的,Roche 454, ABI Solid以及华大基因的Complete Genomics。对于不是这领域非常资深的专家,确实必要性不大了。无非就是用了一下别的较“巧妙”的远离和方法,最终都是PCR许多片段,然后边合成边测序而已。
讲了第一代测序、第二代测序,第三代和第四代呢?先空着,有时间再总结。
由于液体活检技术就两类:PCR与测序。而测序现在一般都得用PCR,所以这里先单独介绍一下PCR是什么。
说实话,这个技术确实很牛,改变了分子生物学许多。自1985年提出聚合酶链式反应来,至今已有30余年,它所扮演的角色仍然不可估量。人类基因组30亿个碱基,听起来很大,要分析它其实很难,因为毕竟它还是太小了,我们要检测样本中的DNA序列,如果这个DNA片段序列只有1条,你敢说你能测到吗?10条呢?还是不敢。可是现在有一种技术可以把它复制成“100万”(随便举个例子,不要对数字太纠结),那么测序就变得容易多了。PCR(Polymerase Chain Reaction, 聚合酶链式反应,以后我决定提到PCR脑海里浮现三个词:变性、退火与延伸),正是这样的技术,它模拟DNA体内的半保留复制,最终将1条DNA经过30~40个循环变成几百万条DNA。由于这个技术已经发展非常成熟,这里就不非常细节的讲了,比较笼统一点。PCR过程:1)引物设计(15~30bp):这一步其实很关键的,首先需要知道目的DNA的两头的序列(如果不知就加已知接头),然后根据互补配对原则两个引物(A链的左端互补,B链的右端互补)就设计好了。2)反应体系准备:五要素(引物、TaqDNA聚合酶、dNTP、Mg2+缓冲液、模板);3)一个循环三个温度三个步骤:90℃~95℃变性(30秒搞定),40℃~60℃退火(引物可以接上去),70℃ ~ 75℃ (延伸);一个这样的循环只需2~4分钟,2~3小时基本就可以扩大百万倍,够了。
基于PCR方法而衍生的方法比较多,整体思路就是我预先期待某个突变,然后用PCR方法去验证自己的想法。下面分别介绍基于PCR方法的一些衍生方法(应用于液体活检的主要是SuperARMS、ddPCR)
根据方法的不同一一介绍。1,ARMS-PCR (Amplification Refractory Mutation System),突变扩增系统,它的敏感性为1%,不满足ctDNA检测要求,提高后的SuperArms还可以检测血液。在组织中检测突变,ARMS法是受到临床医生的广泛认同,为金标准;它的局限在于一次检测突变位点少;原理:纯粹用文字描述确实不容易,不过我还是决定坚决不上图,用文字来说明;一个双链DNA,上面那条链从左至右依次取四个位置A1、B1、C1、D1,下面那条链对应位置为A2、B2、C2、D2;我们假设正常人的B位置为G/C互补配对,此时预期肿瘤病人突变为A/T互补配对;我们设计四个引物,两个外引物(A1头上,D2脚小;这两个配对可以PCR成最长的DNA片段),两个内引物(B1左端一点,B2右端一点;B1左端一点的引物可以和正常人的完全配对,这样如果这个人是正常的话,PCR就得到了B1-D1这个片段;B2右端一点的引物可以和肿瘤病人完全配对,这样如果是肿瘤病人的话,PCR就得到了A2-B2);最后去电泳上跑一跑,看长度就知道到底有没有发生预期突变了。核心要点:其实它就利用了耐热DNA聚合酶的非常专一这个特性,引物的3‘端有一个碱基不和模板配对它就罢工。至于SuperARMS,厦门艾德公司大大小小的会议一直在说,可是就是不讲它到底怎么个Super法,我只知道它灵敏度较SuperARMS有大幅度提高,并可以用于血液检测。2,ddPCR (Droplet Digital PCR,微滴式数字PCR),它的敏感性为0.001%,它的认可度也非常高,可以用来做NGS的验证,最大的特点是还可以定量。1ul的样品,均分到20000个1nl级的微滴里去,基本上每个微滴就只含有一个(或数个,符合泊松分布)DNA;每个微滴就是一个PCR反应系统,进行PCR(仅针对突变后的DNA设计引物);然后能够发出荧光的就代表里面PCR反应成功了,也就意味着该微滴里的DNA发生了预期突变;最后统计20000个微滴有多少是阳性的微滴,然后根据泊松分布及稀释浓度等反推出原来样本中发生突变的个数或者突变率(定量)。ddPCR最大的优势就是可以定量和灵敏度高,劣势是一次只能测一个位点。
原文地址:https://zhuanlan.zhihu.com/p/22917351 |
|