立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 931|回复: 5

[讨论] 能说说测序仪的测序技术和原理是什么吗?

[复制链接]
发表于 2024-9-5 18:18 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2024-9-5 18:19 | 显示全部楼层
测序仪的测序技术和原理多种多样,随着技术的发展经历了几代更迭,主要包括第一代(Sanger测序)、第二代(如Illumina测序)、第三代(如PacBio SMRT测序、Oxford Nanopore测序)和第四代测序技术(仍在发展中,侧重于单分子实时测序和直接电子测序等)。以下是对各代测序技术原理的简要说明:
1) 第一代测序技术(Sanger测序)
Sanger测序,也称为双脱氧链末端终止法,是基于DNA合成反应的原理。在测序反应中,除了正常的脱氧核苷三磷酸(dNTPs)外,还加入了一定量的2',3'-双脱氧核苷三磷酸(ddNTPs),后者在DNA链合成时缺少3'的羟基,导致链的延伸终止。通过分别标记四种ddNTPs(ddATP、ddCTP、ddGTP、ddTTP)并控制它们的比例,可以得到一系列不同长度、终止在特定碱基上的DNA片段。随后,通过聚丙烯酰胺凝胶电泳分离这些片段,根据片段的大小和荧光标记来读取DNA序列。
2) 第二代测序技术(以Illumina为例)
Illumina测序是一种基于边合成边测序的技术,采用了可逆终止化学的方法。该技术使用带有荧光标记的核苷酸,这些核苷酸在合成DNA链时会在特定位置终止,每个循环只添加一种类型的核苷酸,每个循环后通过激光扫描读取荧光信号以确定新添加的碱基,然后洗脱掉终止基团,重复这一过程,直至读取完整序列。这种方法在一块流动槽上并行处理数百万乃至数十亿个DNA片段,极大提高了测序速度和通量。
3) 第三代测序技术(如PacBio SMRT测序、Oxford Nanopore测序)
PacBio SMRT测序:基于单分子实时测序原理,利用零模波导孔(ZMW)捕捉单个DNA聚合酶分子,并在DNA合成过程中直接监测荧光标记的核苷酸的加入,实现长读长和直接检测碱基修饰的能力。
Oxford Nanopore测序:利用纳米孔技术,单个DNA或RNA分子通过一个纳米孔,随着分子通过孔时引起的电流变化来直接读取碱基序列。这种技术可以实现超长读长,适合复杂基因组和直接RNA测序。
美格基因主要做二代和三代测序。二代测序主要用到illumina和华大的不同通量的测序平台,满足客户不同测序需求,三代测序主要用到pacbio和Nanopore。
回复 支持 反对

使用道具 举报

发表于 2024-9-5 18:20 | 显示全部楼层
这篇回答修改自我以前的一篇博客,该文已被各种形式转载
测序,简单来说就是将DNA化学信号转变为计算机可处理的数字信号的一个过程。测序仪就是完成这一过程的机器。这个技术从1977年的第一代Sanger测序技术发展至今,已经足有40年时间。这个回答中我会介绍这些技术各自的原理和技术特点都是什么。
这个技术的发展之路可谓跌宕起伏,测序读长从长到短,再从短到长。虽然就当前形势看第二代短读长测序技术在全球范围内上占有着绝对的垄断位置,但第三测序技术也已在这几年快速地发展着。测序技术的每一次变革和突破,都对基因组学研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。



图1. 测序技术发展历程

第一代测序技术

第一代DNA测序技术用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法或者是1976-1977年由马克西姆(Maxam)和吉尔伯特(Gilbert)发明的化学法(链降解). 并在1977年,由桑格老人家测定了第一个基因组序列——噬菌体phiX-174,全长只有5,375个碱基。虽然与今日的技术比起来根本不算什么,但自此之后,人类获得了窥探生命本质的能力,并以此为开端真正步入了基因组学时代。
研究人员在Sanger法的多年实践之中不断对其进行改进。在2001年,完成的首个人类基因组图谱就是以改进了的Sanger法为基础进行测序的。Sanger法的核心原理是:由于ddNTP(4种带有荧光标记的A,C,G,T碱基)的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA的合成反应,在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP(分别为:ddATP,ddCTP,ddGTP和ddTTP),然后利用凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列(图2)。这个网址为Sanger测序法制作了一个小短片,形象而生动。  
值得注意的是,在测序技术起步发展的这一时期中,除了Sanger法之外还出现了一些其他的测序技术,如焦磷酸测序法、连接酶法等。其中,焦磷酸测序法是后来Roche公司454技术所使用的测序方法,而连接酶测序法是后来ABI公司SOLID使用的测序方法,但他们的核心手段都是利用了Sanger中可中断DNA合成反应的dNTP。



图2. Sanger测序发原理

第二代测序技术

总的来说,第一代测序技术的主要特点是测序读长可达1,000bp,准确性高达99.999%,但其测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。因而第一代测序技术并不是理想的测序方法。经过不断的技术开发和改进,以Roche公司的454技术、illumina公司的Solexa/HiSeq技术和ABI公司的SOLID技术为标记的第二代测序技术诞生了。第二代测序技术在大幅提高了测序速度的同时,还大大地降低了测序成本(速度和成本其实是相辅相成的),并且保持了高准确性,以前完成一个人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周,但其序列读长方面比起第一代测序技术则要短很多,大多只有100bp-150bp。图3. 是第一代和第二代测序技术测序成本作了一个简单的比较,可以看出自第二代测序技术发展出来之后,历史开始发生根本性的改变,测序的成本开始快速实现断崖式下降,也就是业内经常提到的超摩尔定律现象。



图3. 测序成本比较(来源:NIH网站)

下面,我以illumina(目前最大、最成功的NGS测序仪公司)的技术为基础简要介绍第二代测序测序技术的原理和特点。
目前illumina的测序仪占全球75%以上,以HiSeq系列为主。它的机器采用的都是边合成边测序的方法,主要分为以下4个步骤:



图4. illumina测序原理(来源:illumina官网)

1)构建DNA测序文库,图4-1
简单来说就是把一堆乱糟糟的DNA分子用超声波打断成一堆在一定长度范围内的小DNA片段。目前除了一些特殊的需求之外,基本都是打断为300bp-800bp长的序列片段,并在这些小片段的两端添加上接头【注】,构建出单链DNA文库,以备测序之用;
【注】接头在illumina中一般分为P5和P7接头,其中一个带有和flow cell上的探针反向互补的序列,以完成待测序列和探针结合的作用,另外一个接头带有barcord序列以区分不同的样本。连接接头反应,其原理为序列打断后加碱基A,随后接头T单碱基互补连接。
2)测序流动槽(flowcell),图4-2
flowcell是用于吸附流动DNA片段的槽道,也是核心的测序反应容器——所有的测序过程就发生在这里。当文库建好后,这些文库中的DNA在通过flowcell时会随机附着在flowcell表面的槽道(称为lane)上。每个flowcell有8个lane(图5),每个lane的表面都附有很多很多的接头,这些接头能和建库过程中加在DNA片段两端的接头相互配对,这就是为什么flowcell能吸附建库后的DNA的原因,并能支持DNA在其表面进行桥式PCR的扩增,理论上这些lane之间是不会相互影响的,也即是说,测序时他们都在独立反应。



图5. flowcell(实物 VS 示意图)

3)桥式PCR扩增与变性



图6. 桥式PCR扩增(来源:illumina官网)

是NGS技术的一个核心特点。桥式PCR以flowcell表面所固定的序列为模板,进行桥形扩增,如图6所示。经过不断的扩增和变性循环,最终每个DNA片段都将在各自的位置上集中成束,每一个束都含有原来单个DNA模板的很多分拷贝,这一过程的目的在于实现将单一碱基的信号强度进行放大,以达到测序所需的信号要求。
4)测序,如图4-4和图7所示



图7. 边合成边测序(来源:illumina官网)

测序方法采用边合成边测序的方法。向反应体系中同时添加DNA聚合酶、接头引物和带有碱基特异荧光标记的4中dNTP(如同Sanger测序法)。这些dNTP的3’-OH被化学方法所保护,因而每次只能添加一个dNTP,这就确保了在测序过程中,一次只会被添加一个碱基。同时在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉。接着,再加入激发荧光所需的缓冲液,用激光激发荧光信号(图7),并由光学设备完成荧光信号的记录,最后利用计算机分析将光学信号转化为测序碱基。这样荧光信号记录完成后,再加入化学试剂淬灭荧光信号并去除dNTP 3’-OH保护基团,以便能进行下一轮的测序反应。
Illumina的这种每次只添加一个dNTP的技术特点能够很好的地解决同聚物长度的准确测量问题。它的主要测序错误来源是碱基的替换,目前它的测序错误率在0.7%-1%左右——这是很高的精确度。测序周期以人类基因组重测序为例,30x-50x的测序深度对于Hisq系列来说需要3-5天时间,而对于2017年初最新推出的NovaSeq系列则只需要40个小时!
表1. 测序量比较(双流动槽为例,如为单流动槽则测序量减少为下表的一半,时间不变)



测序量比较

*一次测序的数据总产量的单位Gb,不是计算机字节,而是测序碱基的数目(Giga base)*



图8. NovaSeq与其他测序仪测序通量的比较(来源:illumina官网)

上面表1和图8是NovaSeq和其他测序系列的比较,数据相当好。按照这个数据量估算,一台NovaSeq 6000(S4)在跑满的情况下,一年就可以测序6400多人!而且按照以往的经验,illumina的官方公布的数据都是偏于保守的,我们在实际的使用过程中发现高质量(Q30)的read其实占到了总数据的90%以上,远高于官方公布的75%,数据的总产量也同样更高。
第三代测序技术

这是一个新的里程碑。以PacBio公司的SMRT和Oxford Nanopore Technologies的纳米孔单分子测序技术为标志,被称之为第三代测序技术。与前两代相比,最大的特点就是单分子测序,测序过程无需进行PCR扩增,超长读长,以下图9是PacBio SMRT技术的测序读长分布情况,平均达到10Kb-15Kb,是二代测序技术的100倍以上,值得注意的是在测序过程中这些序列的读长不再是相等的,很大一部分原因取决于被测DNA链的完整程度和酶的活性,下文有解析!



图9. PacBio SMRT 测序read读长分布(来源:PacBio官网)

PacBio SMRT
PacBio SMRT技术其实也应用了边合成边测序的思想,并以SMRT芯片为测序载体(如同flowcell)。基本原理是: DNA聚合酶和模板结合,用4色荧光标记A,C,G,T这4种碱基(即是dNTP)。在碱基的配对阶段,不同的碱基加入,会发出不同的光,根据光的波长与峰值可判断进入的碱基类型。



图9. PacBio SMRT 测序原理(来源:Chris Miller)

这个DNA聚合酶是实现超长读长的关键之一,读长主要跟酶的活性保持有关,它主要受激光对其造成的损伤所影响。PacBio SMRT技术的一个关键点是在于如何将反应信号与周围游离碱基的强大荧光背景区别出来。他们利用的是ZMW(零模波导孔)原理:如同微波炉壁上可看到的很多密集小孔。这些小孔的直径是有严格要求的,如果直径大于微波波长,能量就会在衍射效应的作用下穿透面板从而泄露出来(光波的衍射效应),从而与周围小孔相互干扰(光波的干涉)。如果孔径能够小于波长,那么能量就不会辐射到周围,而是保持直线状态,从而可起到保护的作用。同理,在一个反应管(SMRTCell:单分子实时反应孔)中有许多这样的圆形纳米小孔,,即 ZMW(零模波导孔),外径100多纳米,比检测激光波长小(数百纳米),激光从底部打上去后不会穿透小孔进入上方的溶液区,能量会被限制在一个小范围(体积20X 10-21 L)里(图10-A),正好足够覆盖需要检测的部分,使得信号仅仅只是来自于这个小反应区域,孔外过多的游离核苷酸单体依然留在黑暗中,从而实现将背景噪音降到最低的目的。
PacBio SMRT技术除了能够检测普通的碱基之外,还可以通过检测相邻两个碱基之间的测序时间,来检测碱基的表观修饰情况,如甲基化。因为假设某个碱基存在表观修饰,则通过聚合酶时的速度会减慢,那么相邻两峰之间的距离会增大,我们可以通过这个时间上的差异来检测表观甲基化修饰等信息(图11)。



图11. PacBio SMRT 检测甲基化修饰(来源:PacBio官网)

SMRT技术的测序速度很快,每秒约10个dNTP——这其实不是好事,这么快的测序速度带来了一些明显的缺点——测序错误率比较高(这几乎是目前单分子测序技术的通病),可以达到10%-15%,而且以缺失序列和错位居多,但好在它的出错是随机的,并不会像第二代测序技术那样存在一定的碱基偏向,因此可以通过多次测序来进行有效纠错。  
Oxford Nanopore
Oxford Nanopore 的MinION是另一个很受关注的第三代测序仪,俗称U盘测序仪,它真的很小,我亲手拿过,并拆过,图12(左)!这家公司开发的纳米单分子测序技术与以往的测序技术相比都不一样,它是基于电信号而不是光信号的测序技术!



图12. Oxford Nanopore MinION

这个技术的关键点在于他们所设计的一种特殊纳米孔,孔内共价结合分子接头。当DNA分子通过纳米孔时,它们使电荷发生变化,从而短暂地影响流过纳米孔的电流强度(每种碱基所影响的电流变化幅度是不同的),最后高灵敏度的电子设备检测到这些变化从而鉴定所通过的碱基(图13)。



图13. MinION测序原理

纳米孔测序或者其他第三代测序技术,有可能会彻底地解决目前第二代测序平台的不足。另外,MinION的主要特点是:读长很长,而且比PacBio的都长得多,基本都是在几十kb上百kb以上,最新的数据显示可以达到900 kb!错误率是5%-15%(但其实它的错误率不太稳定,有时飚的很高,甚至达到30%),也是随机错误。我想,对于MinION来说,最大的特点除了极小的体积之外,就是数据将是可实时读取的,并且起始DNA在测序过程中不被破坏!这应该可以算是能够上天的能力!然鹅,遗憾地多说几句,目前还没真正公布,细节也不知,自从2012开过一次发布会之后,就没什么声响了。
这种纳米孔单分子测序仪还有另一大特点,它能够直接读取出甲基化的胞嘧啶,而不必像二代测序方法那样需要事先对基因组进行bisulfite处理,这是因为存在表观修饰的碱基激发的电流强度是不同的。这对于在基因组水平直接研究表观遗传等相关现象有极大的帮助。下面是对PacBio和Oxford Nanopore这两家第三代测序技术公司的测序仪做的一个简单比较,可以看出其实成本还是蛮高的,质量也只是还行,期待他们的下一次进化吧。


总结

以上,便是对各代测序技术的原理做了简要的阐述。在这个比较的过程中,可以看到测序成本,读长,错误率和通量是评价一个测序技术先进与否的三个重要指标。其实第一代和第二代测序技术除了通量和成本上的差异之外,测序的核心原理都来自于边合成边测序的思想。第二代测序技术的优点是通量大大提升,成本随着大大减低,使得昔日王榭堂前燕,可以飞入寻常百姓家。总之,再高的科技也只有变成白菜价,才能真正对大众有意义。但二代的缺点是其所引入的PCR过程会在一定程度上增加测序的错误率,并且测序过程中具有一定的系统偏向性,另外就是读长比较短,这会给后续的数据解读带来一定程度的困难和限制。第三代测序技术是为了解决第二代所存在的缺点而开发的,它的根本特点是单分子测序,不需要任何PCR的过程,虽然能有效避免因PCR偏向性而导致的系统错误,而且也能够获得很高的读长,但这个技术还不是很成熟,需要再进化,目前成本也偏高。



图14. 全球测序仪数量分布

参考文献
1. Sanger, F. & Nicklen, S. DNA sequencing with chain-terminating. 74, 5463–5467 (1977). 2. Mardis, E. R. Next-generation DNA sequencing methods. Annual review of genomics and human genetics 9, 387–402 (2008). 3. Shendure, J. & Ji, H. Next-generation DNA sequencing. Nature biotechnology 26, 1135–45 (2008). 4. Metzker, M. L. Sequencing technologies - the next generation. Nature reviews. Genetics 11, 31–46 (2010). 5. Niedringhaus, T. P., Milanova, D., Kerby, M. B., Snyder, M. P. & Barron, A. E. Landscape of Next-Generation Sequencing Technologies. 4327–4341 (2011). 6. Rothberg, J. M. et al. An integrated semiconductor device enabling non-optical genome sequencing. Nature 475, 348–52 (2011).

<hr/>
如果喜欢更多的生物信息和组学文章,欢迎搜索并关注我的微信公众号“碱基矿工”(ID: helixminer)
回复 支持 反对

使用道具 举报

发表于 2024-9-5 18:20 | 显示全部楼层
7月21日更新:
感谢
Alexis Voinov指出原文中谬误之处。对于测序方法的部分我原先的理解不够深刻,以致可能误导了大家,非常不好意思。
商用二代测序的方法(method)有不少名字,例如pyrosequencing、Ion semiconductor sequencing等等都是商业称谓,但是如果从生化的角度上大体都可归入SBS和/或SBL(取决于使用聚合酶还是连接酶)。答主原先将半导体测序与SBS、SBL并列的方法显然是有错的。
-------------------------------------------
7月20日更新:
原本的回答主要是针对题主特别关注的“PCR与测序仪之间的关系”而做的补充,没想到被推荐,显得文不对题。现在简要介绍一下DNA测序的基本逻辑。
测序仪的原理到底如何,这个问题实在是太广,详细展开只怕要专门写一本书。我试着从基本逻辑的层面上为大家阐释一下DNA测序的目的和实现手段;具体每一种方法的详细原理稍后再为大家列出一些补充资料。
首先,神马是测序呢?顾名思义,测序(sequencing)就是测量出一段序列的意思。广义的测序不仅仅包括了DNA的测序,还包括蛋白、RNA等等别的物质构成的序列。你可能会问,我有一串黑白珍珠项链,数一下顺序算不算测序呢?嘛……答主认为是算的(骗谁啊)。待我慢慢道来:



这是一串黑白珍珠项链,我们仔细观察,会发现这中间包括两种基本单元:黑珍珠和白珍珠。要搞明白它的序列要怎样去测呢?答案很简单:用肉眼看(坑爹呐),因为这是简单经济的方法。对于这串项链的序列我们可以作如下的表示:
WWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWB
WWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBWWBR(连接环)BBWWB……
您别笑,其实这个过程与DNA测序如出一辙——它们的目的是一样的,只是对DNA进行测序,要求我们去观察一个物理尺度远小于这串项链的长长的分子,由四种基本单元组成(连接了ATCG四种碱基的核苷酸),表示一下就是:
……GAGCGGATAACAATTTCACACAGG……
这个分子有多小呢?构成这个分子的每个最小单位(核苷酸)只有大约0.34纳米。它有多长呢?以我们的人类基因组为例,一个染色体里面的DNA序列动辄有一两亿个碱基对。(似乎比数项链复杂很多呢)


(图中A的大小是0.1纳米)
但这还没完,这条长长的分子还会扭曲折叠在一起(想象一下口袋里面团成一团的耳机线),这样细微而复杂的结构,想通过传统的光学手段进行直接观测是几乎没有希望的(远小于可见光的波长)。那电镜可不可以呢?且不说当年的电镜技术,就算是到了今天,心血来潮看个局部还行,用来测序根本不具备可操作性。
所以在当时来看,DNA测序完全是Mission Impossible!(说了半天什么都没说啊摔)
Against all odds, 生物学家们终于想到了用来测序DNA分子的办法,而且不止一种。
最早实现的方法就是双脱氧终止反应法(所谓的Sanger测序)。这种方法是怎么 测序的呢?也是用肉眼看!没错,Sanger先生在70年代就成功地将DNA序列碱基差异带来的微弱信号放大到了肉眼可见的级别,堪称信号放大的奇迹。
我们继续以珍珠项链为例:

假设我是瞎子,而每个珍珠摸上去都一模一样,我该如何弄清楚珍珠项链的顺序呢?好在我很幸运地拥有一个项链复制机(DNA聚合酶)可以帮我复制珍珠项链,只不过复制出来的颜色是反着的。而我又有一包穿孔的黑珍珠和一包穿孔的白珍珠可以为机器提供复制的原材料。现在我能不能搞清楚珍珠项链的顺序了呢?Sanger先生的办法是这样的:


  • 把白色的穿孔珍珠中间挑出一小部分,把一侧的孔给堵住,做成一侧有孔的白色珍珠。若是复制机在本来该串白色珍珠的地方串到一个一侧有孔的白色珍珠,就会停下来不再继续。

  • 把模板珍珠项链、黑白穿孔珍珠和一侧有孔的白色珍珠全部提供给复制机,机器就会不断复制出不完整的反色项链。




(原来的模板项链)











(项链复制机复制出几种不同的反色项链)



  • 这样我得到了很多不完整的项链片段,它们有两个共同点:一端都一样,另一端都是白色的。我数一下这些片段的长度,可以得到这样的信息:


    • W
    • ???W
    • ??????W
    • ?????????W
    • ……

  • 仔细分析,这些信息已经够我推测出原本的项链排列是:B??B??B??B…了,考虑到这个项链只有黑白两色,我可以不用换堵黑色珍珠的孔再做一遍实验就可以得知原本的项链是BWWBWWBWWB…的序列了。

Sanger法进行DNA测序也是一样的,无非是拥有四种颜色的珍珠项链,具体方法大家脑洞一下即可。

至于上面所说的“数数”的过程是通过电泳(electrophoresis)的方式实现的。简单来说就是在一个“泳池”里面让DNA片段“赛跑”,片段越长“跑”得越慢,去一个合适的时间,不用等所有片段都“跑”到终点,停下来显像,根据看到“条带”的位置就可以反过来推测相应DNA片段的长度了。
至于怎么让DNA“跑”起来嘛,因为DNA分子带有一定的电性,给“泳池”加上一个恒定方向的电场就可以了。
Sanger测序的具体方法可以参见王龙腾的回答,写得很具体。
----------------------------------------------
至于今天现代的生物学mín家gōng们是如何进行DNA测序的,有很多商业解决方案。
生化测序按照代际来分:


  • 一代测序(Sanger测序法,本质上都和上面数珍珠项链的方法是一样的)
  • 二代测序,普遍具有高通量的特点。

    • SBL(Sequence by Ligation):SOLiD、华大Revolucity(前CG)等等
    • SBS(Sequence by Synthesis):illumina 全系列(前SOLEXA)、华大BGI-Seq 500(未量产)、Ion Torrent PGM、Ion Proton™、Roche 454等等

  • 三代测序,普遍具有单分子、近乎实时的特点。

    • SMRT™:PacBio旗下测序仪
    • Nanopore(未商用):Oxford Nanopore MinION(u盘大小测序仪,刚有原型机,可惜准确率太低)、Genia(George Church大神力荐,已被Roche$125MM重金收购,希望不要被毁掉),还有illumina自家的三代测序技术目前还很神秘。


说到二代测序的原理无外乎是分为如下几个步骤:

  • 将待测序DNA片段化,经过特定的处理以符合相应测序平台的输入要求,此过程称为建库
  • 上样,(在机器内)通过特殊的PCR反应过程将待测片段原位(in situ)扩增。
  • (在机器内)通过对DNA反应过程进行变量控制(时间、空间),并捕捉此过程中释放出的相应的(因扩增而变得可观测的)信号。这些信号可以是荧光信号(illumina、454、华大CG等)或是释放质子所引致的局部酸碱变化(Ion Torrent)。
  • 计算机采集数据,并进行组装(将片段还原成长序列)。
顺便说一句,二代测序又被成为NGS(Next Generation Sequencing,次世代测序),十年前被用于区分一代测序。鉴于现在二代测序已经广泛使用而一代测序濒临淘汰,很多人将NGS重新解释为“Now Generation Sequencing”。

三代测序朱一凡已经大致讲了,可惜只提到了nanopore测序,并不全面。
实际上目前唯一已经商用的三代测序技术是PacBio的SMRT™技术:不同于nanopore的直线穿过,SMRT将DNA分子连成环后不断测序以解决准确率低的问题。具体方法非常精彩,限于篇幅有限不再多说,有兴趣的同学可以自己去查找资料。

除此之外还有另辟蹊径的,例如使用MALDI-TOF,实际上是一个质谱……


(快速、低成本但是应用范围太窄)
以及一些脑洞大开的方法,例如上次在MIT和大牛Joe Jacobson聊天的时候他随手扔给我一个“重复单分子杂交核酸测序(Nucleotide sequencing via repetitive single molecule hybridization)”的专利,说这玩意可以让重测序低至1美元。。


本质上是通过在一块CMOS板子上排列所有可能的n-mer DNA做adaptor,再把目标序列打成极小片段通过杂交获取信号后再用数学方法运算而实现。我管这种方法叫做“数学测序”……
具体原理嘛也不详述了,链接如下自己看吧:
United States Patent: 7604941

写到这觉得也讲差不多了,索性多扯两句时事。
总之呢,这年头人才辈出。
国外的技术创新可谓源源不断,前面提到那位Joe Jacobson大神原本是搞物理的。他发明了e-ink,没错就是kindle上那个e-ink,那时候他还是本科生……不久后他的公司Gen9率先搞出高通量DNA合成技术……基因技术玩的就是跨界!(智商受到碾压)
好在咱国内起步不低,答主的老东家华大基因通过海外收购+研发的方法也整出了自己的高通量测序技术,不管有人怎么冷嘲热讽,始终是零的突破,汪老师魄力可见一斑。最近听说谢晓亮老师的测序仪也开始准备产业化了,答主觉得无论如何也值得期待。(感谢
Alexis Voinov的提醒,谢小亮老师现在应该还是在做二代测序)
生物或许又是一个我国可以与美帝平起平坐的行业,而这其中首当其冲就是测序技术。搞不定测序技术的国产化,很多应用始终要受制于人,相信很多搞生物的小伙伴们一定深有体会。11年华大买完测序仪illumina就给测序试剂坐地起价的事情至今还历历在目,不自己搞测序能行么?前阵子在知乎上看到不少人看不起华大收购CG,觉得没有核心技术干不过illumina云云……答主特别想说,你行你上吧。


以下是原答案
-----------------------------------------------
楼上很多答案都深入浅出的阐(bān)明(yùn)了目前几种主流的、未成为主流的、抑或是已经被淘汰的测序技术及其原理,但是总觉有哪里不对。长期潜水的我忍不住来补充两句。

首先,实名反对
jamesr的答案。
Sanger测序可以看成扩增长度随机的PCR反应+毛细管电泳
PCR(Polymerase Chain Reaction)反应的目的恰恰是从混合的DNA样品中以几何级数复制起始及结束位置均固定的任意DNA片段以便后续研究,这个过程第一次实现了(in vitro的)“扩增”,这也是PCR的伟大之处。而例如Sanger测序中用到的仅仅是通过一段的引物对DNA进行复制;而利用聚合酶来进行DNA的复制(in vitro)早已有之但根本不能被称作是PCR反应。

接下来我们进入正题。
题主问了两个问题:

  • 测序技术和PCR有关系么?
  • PCR技术的发明是如何对测序产生促进作用的?

我们先说第二个问题:
这个问题本身无解,因为,
DNA测序技术早于PCR技术。
DNA测序技术早于PCR技术。
DNA测序技术早于PCR技术。
重要的话要说三遍。
人们往往因为PCR技术的基础与应用广泛而想当然的认为“高大上”的测序技术应当是前者基础上技术发展的产物。个人认为这是分子生物学行业内最广泛存在的误区之一,很多资深的行业者也会产生这种幻觉。
准确来说,恰恰是最初的DNA测序技术促进了PCR技术的发展。

接下来说第一个问题:
答案显而易见:有关系,关系很大。
这里一定要提及另一个大多数答主忽略的方面:DNA合成技术。
上世纪40年代开始,科学界形成了DNA为遗传物质载体的共识,在随后的50年代,又由于DNA双螺旋结构的解析而确定了接下来分子生物学的发展方向:搞明白DNA怎么运作。
所以顺理成章地,人们开始研究如何测量DNA序列的碱基排布。这种测量由间接观测开始(linkage mapping),直至70年代第一次通过Sanger测序(双脱氧终止反应+跑胶)实现直接观测而进入正轨。这20年的时间内人们想尽一切办法弄清楚DNA分子的性质,而研究其性质最好的方法就是:人工合成。
DNA合成技术随着DNA测序技术的发展而突飞猛进,由50年代对于两个核苷酸连接的试验性探索直至80年代初期ABI第一次实现商业化、相对较长的DNA单链化学合成。
而PCR技术恰恰就出现在1983年,这是为什么捏?
因为……因为PCR需要引物啊(摔),引物是合成出来的啊。引物对于PCR的重要性不言而喻,因而大规模的PCR应用需要两个前提:

  • 对于模板序列的了解(依赖于DNA测序技术)
  • 准确、批量的生产引物(依赖于DNA合成技术)
可以说,PCR的出现使得基因研究终于驶上了快车道,随后的高通量测序技术又倒逼PCR技术的进化,两者是相互依存而又相互促进的辩证关系(答主没上过大学,马列毛概学得不好表打我)

不过归根结底,没有测序技术的出现是不可能有PCR这种应用的。
p.s.懒得查资料凭记忆写的,如有谬误望不吝指教。
利益不相关:现在貌似都流行利益相关啊?答主想了很长时间,最后很悲桑地发现,咱既不是生产测序仪的又不是研发PCR技术的,就是个使用者,利益相关个毛线啊。。
回复 支持 反对

使用道具 举报

发表于 2024-9-5 18:21 | 显示全部楼层
我不是生科,从来没做过测序,但是见到这道题实在是手痒~
首先声明:
1、我写的这个测序方法是正在发展的一种方法,而且短时间内并不能发展成为有效方法。
2、虽然我没有写ref,但是确实有人发表过,只是我实在找不到了......
3、凭印象写,大家了解个原理就好了,细节肯定会有问题,欢迎打脸
4、如果谁能找到ref,还请务必发给我!感激不尽!!
~~~~~~~~~~~~~正文~~~~~~~~~~~~~~~
上面大家讲的都是各种高通量技术,换言之,要很多很多DNA才能测一个序,PCR吭哧吭哧转好久才行。而我要讲的,则是一种次时代玄幻版单分子测序技术~
没错,不要PCR,不要998,只要一个分子~
某某年,某某课题组在研究通道蛋白模拟技术,做出来了一个神奇的通道蛋白类似物


没错,就是一个洞。他的剖面图是这样的:


里面就是一个洞,简单到爆。这个洞中间是有一个向内突出的结构的,是洞最窄的地方,图里也是可以看出来的。这个分子有一个神奇的性质,就是会自动的钻进磷脂双分子膜


红的就是磷脂分子,我不会画大家发挥想象力= =
然后脑洞大开的某某科学家就开发了一个体系


左右两个小池子,里面放上电解质溶液。两个池子中间有一个非常非常小的洞,洞上贴着细胞膜。把刚才做好的通道蛋白类似物丢进去,就会自己插在膜上,就像上图所示,形成了一个“两个池子由一个通道蛋白的洞连着”的结构。把一个DNA分子丢在一边,加电压,测电流。


然后DNA就钻进去啦!虽然我不懂为啥,大概是因为DNA本身带电,然后就做成了一个微型的电泳吧= =。而且钻进去的是单链的DNA,通道是装不下双链DNA的,DNA在进到洞里之前解旋了。


精彩的部分来了:单链DNA钻进了洞里,各个核苷酸就会逐个通过洞里最窄的那个口。窄口比碱基大一点,就会留下一点空隙让电解质中的离子通过空隙。四种碱基大小不同,留的空隙大小不同,电解质离子通过的速率就不同,上上图中电流表的示数就不同。于是乎,电流表显示的不同电流大小就对应着不同的碱基通过了窄口!!!


然后就有了这么一张图,不同的电流大小意味着不同的碱基。
用标准的,单一碱基的序列跑几遍,就知道了碱基和电流的对应关系,测序就开始了!
一条DNA!丢进去跑一圈!序列就全都搞定了!
不要PCR,不要998,只要一条DNA!!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
天才之作!天才之作!天才之作!
不过现在还是有一些问题的,比如说单分子操控的技术成本太高,比如DNA总是在测到一半的时候断掉= =,但是不得不说这个想法真是,remarkable!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
好像有点跑题?无所谓啦!
还有!如果谁找到了原文献,恳请您发给我~~~非常感谢!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
大概就是这样,吐槽我画画不好的


我女朋友画画好啊嘿嘿嘿~~~~~~
回复 支持 反对

使用道具 举报

发表于 2024-9-5 18:21 | 显示全部楼层
哈哈哈!我来捡漏啦!
测序仪简单的来说!
测序五大宝!万变不离其宗!
测序仪说简单了,就是一个光学显微镜!
Proton PGM除外,
目前暂说主流荧光成像的方法。
Camera+样品载玻片+试剂舱+流体系统+工作站
题主想科普,所以撇开专业术语,用最简单的语言表达!不装逼!
显微镜用过吧!
样品载玻片:将样品DNA通过化学PCR 扩增(为什么扩增,因为二代测序仪就是因为高通量高数据量而生的,通过大量数据来分析,而不进行扩增怎么知道渺小的DNA 差异呢?),然后样品牢固的固定在芯片上,通过加入化学荧光试剂结合到DNA的不同碱基(ATCG)上。
Camera:是的,二代测序一般都用光学成像系统,因为快啊,因为省钱啊。哈哈,因为之前的样品加入了化学荧光试剂,那么在我给出特定波长的光照射到样品上,那么光就会给Camera捕获到。不同的碱基(ATCG)所带的荧光是不同的,而且激活碱基的光的波长也不同的。所以,照相机就可以捕获到特定碱基的信号而且不会影响到其他碱基的信号。你问怎么做到的。行内的测序工程师都清楚,不能说太多,可以出门右转百度。
试剂舱:因为DNA是有长度大小哒,既然叫测序,那么肯定有个序列才叫测序,测序的过程需要连贯的进行化学反应,然后光学成像,然后数据处理,然后化学反应,光学成像,数据处理。是不断一个又一个的循环。因此,在测序仪反应的过程中,需要不断的添加化学反应的试剂。试剂会根据不同的测序仪设计,专门添加一个流体系统,其实说简单了,就是一个泵加几条塑料管。哈哈,看起来简单,背后涵盖了工程师多年积累的心血,如何防止产生气泡,如何控制泵液体积,如何防止漏液,如何防止样品互相污染,如果高效稳定的切换各个流路?应该使用真空驱动还是空压驱动?小小的部件,背后大大的智慧。
流体系统:为什么二代测序仪需要用到流体系统呢,不用气体或者固体?其实是和这个测序仪的原理相关的,流体的优势不得不说,易控制,能定量,稳定,等各种因素。流体系统是二代测序仪必不可少的。负责试剂泵入芯片内部进行化学反应,然后排出废液。既然用到液体,流体系统必不可少。
工作站:二代测序一个仪器运行下来可以达到200-300G甚至更多,国内某龙头老大的测序仪更不用说了。如果说Illu是一叶扁舟,那么他就是航母级别的测序仪了。既然数据产出如此巨大,必须有工作站对产出数据进行处理压缩等操作,必不可少。

当然以上说的都是主要部件,不同测序仪的设计思路和风格各异。还是那句话万变不离其宗,其实并不难。每一个人性化的界面以及大数据稳定的产出一定是背后默默付出的工程师和开发者的心血。现测序仪迭代太迅速了!目的都是看中未来基因产业的一片蓝海!即互联网时代下一个改变人的生活的,可能就是他。

利益相关:是

我就不说我公司名,吹咩,吹牛逼又不涨工资。哼!


想要成为生物届的谷歌,员工福利任重而道远啊。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表