立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 70|回复: 0

[分享] 我又学了一遍测序

[复制链接]
发表于 2025-1-22 14:58 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×


测序技术进化图
虽然之前已经学习过了测序的知识,不过当时更多的是笔记的整理和针对重点的记忆,回想起来我还是有很多东西搞不清弄不懂,所以在这个时间相对充裕的环境里,我,又学了一遍测序
首先,测序是干嘛呢?

你大概知道DNA是很长很长的链子,由很多很多脱氧核苷酸组成,脱氧核苷酸之间的差异在于碱基,有四种,分别是A T C G。我们想要探索生命的语言,就要先将他们的文字“A T C G”记录下来,特别是他们的排列顺序,测序就是这样一个过程。
Sanger测序--“双脱氧”链终止法

Sanger测序,又称为第一代测序或双脱氧链终止法,是由Frederick Sanger在1977年发明一种用于确定DNA序列的经典方法。Sanger测序的原理是利用DNA聚合酶来合成新的DNA链,同时利用链终止剂(双脱氧核苷三磷酸,ddNTPs)来阻止链的进一步延伸,从而产生一系列长度不一的DNA片段,这些片段的末端恰好是被双脱氧核苷酸终止的位置。
或许你看完了上面的原理发现只是看完了,要弄明白sanger测序的原理,你得先知道一些基础知识
每一个脱氧核苷酸(dNTP)都由一个含氮碱基、一个脱氧核糖以及一个或多个磷酸基团组成。核苷酸手拉手形成【3%27,5%27磷酸二酯键】聚合组成长长的DNA链。
具体来说,一个核苷酸的3%27(三号碳位置)上的羟基(OH)与下一个核苷酸的5%27(五号碳位置)上的磷酸基团反应,通过脱去一个水分子(H2O),形成一个酯键,即3%27,5%27磷酸二酯键。
断臂杨过ddNTP
ddNTP缺少三号碳位置上的羟基,不能与下一个dNTP反应,DNA链的合成便终止于此处。



用一个形象的比喻就是每个核苷酸都”张开怀抱“,伸出两条胳膊与上一个脱氧核苷酸牵手后,等待下一个张开双臂的脱氧核苷酸倒来,然而ddNTP却是个”断臂杨过“,与上一个脱氧核苷酸牵手后,下一个脱氧核苷酸到来却无手可牵,只能遗憾离场,因此,这条DNA的连接也就到此结束。



接下来或许你可以根据这个图搭配详细步骤再来仔细理解一下
Sanger测序的步骤:


  • 在四个独立的试管中,每个试管包含DNA模板、测序引物(与DNA模板的一端结合)、DNA聚合酶、缓冲液、四种脱氧核苷酸(dNTP),以及一种特定的双脱氧核苷酸(ddNTP)。
  • 接着在每个反应中,DNA聚合酶会从引物开始遇到dNTP延伸,或者遇到ddNTP,链的延伸停止。由于DNA链遇到ddATP是随机事件(还可能遇到dATP而正常地延伸),该反应会产生不同长度的DNA链。
  • 然后在变性聚丙烯酰胺凝胶的四个泳道中分别对四个试管中的产物进行电泳,最后在放射自显影下我们可以读取DNA的序列。



sanger步骤
一句话总结,Sanger测序的核心原理就是在使用DNA聚合酶来合成新的DNA链中,利用ddNTP的终止功能得到一系列终止于某种碱基处不同长度的DNA片段从而确定DNA序列。
--with time going by--
通过几十年的改进,第一代测序仪的读长可以超过1000 bp,原始数据的准确率可以高达99.99%,测定每千碱基序列的成本是0.5美元,每天的数据通量可以达到60万碱基。
但是,不管怎么改进,第一代测序技术在速度和成本方面都已达到了极限,因为需要序列扩增及对电泳分离技术的依赖(难集成),使其难以进一步提升分析的速度和难以提高并行化程度,并且难以通过微型化降低测序成本。
(想一想要拿着移液枪在实验室打很久魔法药水还有跑胶就很麻烦吧)
在此种情况下,第二代测序技术(Next-generation sequencing)应运而生。




第二代测序(Next-Generation Sequencing, NGS),也被叫做高通量测序(能够在短时间内生成大量的序列数据),具有通量高,成本低,速度快,读长短的特点,如 图所示。



以illumina/solexa为例对比
其测序反应通过边合成边测序(Sequencing By Synthesis, SBS)的方式进行,即在DNA合成的过程中实时监测新加入的核苷酸,以确定序列。具体技术包括但不限于:

  • Illumina的可逆终止子法:使用可逆终止的核苷酸,在每个循环中只添加一个核苷酸,根据荧光信号确定核苷酸类型。
  • 454/Roche的焦磷酸测序:在DNA合成过程中释放的焦磷酸会被转化为光信号,从而确定下一个碱基。
  • Ion Torrent的半导体测序:利用氢离子释放产生的电流变化来检测碱基的添加。
下面我们着重看看Illumina测序
Illumina测序

Illumina测序的原理其实可以从一代测序的痛点来看看
难并行化

在Illumina平台上,数百万乃至数十亿的DNA片段可以同时进行测序。
这种并行化是通过在一个被称为“流动池”(flow cell)的玻璃载片上构建DNA簇来实现的。流动池内部划分为多个“泳道”(lanes),每个泳道都可以独立进行测序反应,而每个泳道中又包含成千上万个独立的微反应区。在这些微反应区内,通过桥式PCR(bridge PCR)或循环序列扩增(cyclic sequencing-by-synthesis)生成大量的DNA簇,每个簇包含数以万计相同的DNA分子拷贝。这样一来,每次测序运行就可以处理海量的DNA片段,极大地提高了测序的通量。
难集成化

Illumina测序系统的另一个显著特点是高度集成化。整个测序过程,包括文库制备、簇生成、测序和数据处理,都被集成到一套自动化的工作流程中。这不仅简化了实验操作,减少了人工干预的错误,还提高了整体的效率和一致性。
一代测序存在对电泳分离技术的依赖,需要DNA合成结束后再进行电泳。第二代测序技术通常采用边合成边测序的方法,这意味着在DNA合成的过程中就可检测到新加入的核苷酸,无需后续的电泳分离。
难微型化

Illumina测序技术的微型化体现在它的高密度微阵列设计上。流动池的每个泳道都是一个微缩的实验室,其中包含数以百万计的微反应区。这些微反应区足够小,以至于可以容纳在一块相对较小的玻璃载片上。这种微型化的设计使得Illumina能够在一个非常紧凑的空间内进行大量的测序反应,从而降低了物理空间需求和成本。
此外,Illumina测序平台上的化学反应也被优化为微型化版本,比如使用极少量的反应物和能量来完成测序反应,这有助于减少试剂消耗和能源使用,同时也提高了反应的可控性和效率。
看完这些大致对二代比一代的升级之处有了印象
下面我们继续结合图片看看illumina测序的具体流程
illumina实验步骤


  • 文库制备 %28Library Preparation%29
首先,需要将待测的DNA样本打断成较短的片段(通常为几百个碱基对)。这些片段的两端会加上特殊的接头序列(adapters),这样做的目的是为了便于后续的测序过程。接头序列包含了一段用于后续PCR扩增的引物结合位点,以及用于后续测序过程中与流动池(flow cell)表面结合的序列。



文库制备

  • 集群生成 %28Cluster Generation%29


  • 流动池(Flow Cell):这是一个小型芯片,表面有成千上万个纳米级的孔或位置,用于固定DNA片段。
  • 桥式PCR(Bridge PCR):带有接头的DNA片段被固定在流动池表面的引物上,随后进行PCR扩增,形成所谓的“DNA簇”。这些簇是DNA片段的多个拷贝,它们紧密地排列在一起,形成一个“簇”(cluster)。每个簇中的DNA分子都是同一原始DNA片段的拷贝。
或许你会好奇这里复制这么多搞成一簇干嘛,看完步骤3我们再回头看看




集群放大


  • 边合成边测序(Sequencing by Synthesis, SBS)
这是Illumina测序的核心步骤。测序反应使用DNA聚合酶和荧光标记的可逆终止核苷酸(dNTPs)。这些核苷酸在3%27端有一个可逆的阻断基团(类似ddNTP),使得每次循环中只能添加一个核苷酸。每个dNTP还携带一个不同的荧光标签,这样当正确的核苷酸被添加到DNA链上时,会发出特定的荧光信号,可以被检测器捕获。
测序过程如下:

  • 向流动池中加入DNA聚合酶和四种带有不同荧光标记的dNTPs。
  • 当DNA聚合酶遇到模板上的下一个碱基时,会将相应的荧光标记dNTP添加到正在生长的链上。
  • 添加完成后,通过检测器读取荧光信号,确定新添加的碱基类型。
  • 之后,荧光基团和可逆阻断基团被化学切割,准备下一轮循环。
  • 这个过程重复进行,直到达到预定的测序长度。


测序
为什么我们要进行桥式PCR呢?

  • 信号增强:在高通量测序中,单个DNA分子产生的信号非常微弱,难以检测。通过桥式PCR,单个DNA分子可以在固相载体表面进行指数级扩增,形成一个包含大量相同DNA序列的簇(Cluster)。这个簇可以产生足够强的信号,使得测序读取的荧光信号能够被检测设备清晰地捕捉到。(有点类似于一人一根荧光棒,一个荧光点太小容易看不到,那就通过pcr搞出一堆分身来变成一小片”荧光湖“)
  • 保证测序准确度:由于每个簇包含多个相同的DNA拷贝,即使在测序过程中出现少量的错误,通过重复测序和数据分析,也能够纠正这些错误,从而提高测序的准确性。
一句话总结:Illumina/Solexa第二代测序的核心原理是在固相载体上进行桥式PCR以创建DNA簇,随后通过边合成边测序(Sequencing by Synthesis, SBS)的方法,利用荧光标记的可逆终止核苷酸实时监测新合成的DNA链,从而实现高通量平行测序。
总的来说,二代测序大致都有这么几个共同点

  • 将目标DNA剪切为小片段
  • 单分子独立扩增
  • 每次只复制一个碱基%28A,C,T,G%29并检测信号
  • 高分辨率的成像系统
与第一代测序仪相比,以合成测序为基础的下一代测序平台速度显著提高,成本明显降低。每台设备每天产出100 Gb碱基的序列不足为奇。
但是,读长短成了下一代测序平台的致命伤 ,这主要是由于DNA簇中存在的光学信号移相造成的。另外,由于需要序列扩增,不同长度的片段也不容易实现均一扩增。
也就是说,我们看到的荧光信号其实非常依赖于测序的同步性,最好的情况就是像阅兵一样齐刷刷的展示第n个碱基的荧光颜色,但现实往往是军训,总有人慢半拍,也总有人快半拍,随着读长的累计这些错误也逐步累积,当累计到了一定长度,一个荧光湖里”四彩斑斓“,也就彻底分不清是什么碱基了。。。



而应运而生的单分子测序技术是解决这一问题的一种方法。
第三代测序技术,也被称为长读长测序(Long-Read Sequencing),可以看出大家对第三代测序技术的期待--就是要长!它主要基于单分子信号检测DNA序列,无需PCR扩增。目前有两种主流技术,分别是PacBio公司SMRT %28single molecule real-time%29测序技术和Oxford Nanopore Technology的纳米孔测序技术。
PacBio-SMRT




PacBio-SMRT
Pacbio SMRT原理:DNA 聚合酶和模板结合,4 色荧光标记4 种碱基(即是dNTP),在碱基配对阶段,不同碱基的加入,会发出不同光,根据光的波长与峰值可判断进入的碱基类型。每秒约10 个dNTP
Pacbio SMRT的关键技术就是 ZMW(Zero Mode Waveguide,零模波导孔)
原理 将反应信号与周围游离碱基的强大荧光背景区别出来
在一个反应管(SMRT Cell,单分子实时反应孔)中有数以百万计的圆形纳米小孔,即ZMW(零模波导孔),外径100 多纳米,比检测激光波长小(数百纳米),激光从底部打上去后不能穿透小孔进入上方溶液区,能量被限制在一个小范围(体积20x10-21L )里,正好足够覆盖需要检测的部分,使得信号仅来自这个小反应区域,孔外过多游离核苷酸单体依然留在黑暗中,从而实现将背景降到最低。
Nanopore




NANOPORE
纳米孔测序则完全抛弃了传统武器荧光检测,而是利用核苷酸本身的差异使用特征性电流变化,实时监测并记录某条DNA/RNA链通过纳米孔的电流变化图谱,从而实现单分子测序。
测序原理:
(1)解螺旋,将双链DNA解开成单链。
(2)DNA单链分子通过一个孔道蛋白,孔道中有个充当转换器的蛋白分子。
(3)DNA单分子停留在孔道中,有一些离子通过带来电流变化,而不同的碱基带来的电流变化是不同的。
(4)转化器蛋白分子感受5个碱基的电流变化。
(5)根据电流变化的频谱,应用模式识别算法得到碱基序列。
image-20240629005522711
一句话总结三代测序技术的核心原理,就是利用单分子实时测序,通过监测单个DNA聚合酶添加碱基或核酸通过纳米孔时的信号变化,直接读取DNA序列,无需PCR扩增

原文地址:https://zhuanlan.zhihu.com/p/16997478780
楼主热帖
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表