1. DNA测序技术的发展历史 DNA测序技术发展快速。70年代末,WalterGilbert发明化学法、FrederickSanger发明双脱氧终止法手动测序,同位素标记;80年代中期,出现自动测序仪(应用双脱氧终止法原理)、荧光代替同位素,计算机图象识别;90年代中期,测序仪重大改进、集束化的毛细管电泳代替凝胶电泳;2001年已经完成人类基因组框架图。 2. DNA测序技术的测序原理 化学试剂处理末段DNA片段,造成碱基的特异性切割,产生一组具有各种不同长度的DNA链的反应混合物,经凝胶电泳分离。化学切割反应:包括碱基的修饰修饰的碱基从其糖环上转移出去在失去碱基的糖环处DNA断裂。 3. DNA测序常见方法 3.1 第一代测序 主要以 Sanger 测序为代表的直接检测技术和以连锁分析为代表的间接测序技术。Sanger法测序的原理其基本原理即双脱氧核苷三磷酸(dideoxyribonucleoside triphosphate,ddNTP) 缺乏PCR 延伸所需的 3'-OH,因此每当 DNA 链加入分子 ddNTP,延伸便终止。每一次 DNA 测序是由 4个独立的反应组成,将模板、引物和 4 种含有不同的放射性同位素标记的核苷酸的 ddNTP 分别与DNA 聚合酶混合形成长短不一的片段,大量起始点相同、终止点不同的 DNA 片段存在于反应体系中,具有单个碱基差别的 DNA 序列可以被聚丙烯酰胺变性凝胶电泳分离出来,得到放射性同位素自显影条带。依据电泳条带读取 DNA 双链的碱基序列。Sanger测序这种直接测序方法具有高度的准确性和简单、快捷等特点。依然对于一些临床上小样本遗传疾病基因的鉴定具有很高的实用价值。值得注意的是,Sanger 测序是针对已知致病基因的突变位点设计引物,进行 PCR 直接扩增测序。单个突变点的扩增包括该位点在内的外显子片段即可,不必将该点所在基因的全部外显子都扩增。Sanger 测序对于有致病基因位点明确并且数量有限的单基因遗传疾病的致病基因的检测是非常经济和高效的。Sanger 测序目的是寻找与疾病有关的特定的基因突变。对于没有明确候选基因或候选基因数量较多的大样本病例筛查是难以完成的。 连锁分析采用的是间接测序法。遗传标记是指在人群中表现出多态现象的 DNA序列,可追踪染色体、染色体某一节段或某个基因座在家系中传递的任何一种遗传特性。它存在于每一个人,但大小和序列有差别,具有可遗传性和可识别性。目前采用第二代遗传标记,即重复序列多态性,特别是短串联重复序列,又称微卫星标记。连锁分析是以连锁这种遗传现象为基础,研究致病基因与遗传性标记之间关系的方法。如果控制某一表型性状的基因附近存在遗传标记,那么利用某个遗传标记与某个拟定位的基因之间是否存在连锁关系,以及连锁的紧密程度就能将该基因定位到染色体某一位置上。1986 年 Morton 等提出优势对数记分法 (log odds score method,LOD),主要检测两基因以某一重组率连锁时的似然性。LOD 值为正,支持连锁 ;LOD 值为负,则否定连锁。通过计算家系中的微卫星标记与致病位点之间的 LOD 值,可以初步估算二者间的遗传距离及连锁程度,从而确定该基因在染色体上的粗略位置。然后利用该区域的染色体基因图谱,分析定位区域内所有基因的功能与表达,选择合适的候选基因进行突变检测,最终将致病基因定位或克隆。采用连锁分析进行基因检测存在很大的局限性。不但所需遗传样本量较大,一般要求提供三代及以上遗传家系患者血样,而且数据量大、处理复杂、产出速度较慢、定位不够精确。 3.2 新一代测序 (NGS) 主 要 包 括 全 基 因 组 重 测 序 (whole-genomesequencing,WGS)、全外显子组测序 (whole-exomesequencing,WES) 和目标区域测序(Targeted regionssequencing,TRS),它们同属于新一代测序技术。总体而言,NGS 技术具有通量大、时间短、精确度高和信息量丰富等优点,使得遗传学者可以在短时间内对感兴趣的基因进行精确定位。但这些不同的测序技术在测序范围、数据分析量以及测序费用和时间等方面又有很大差别,如果选择适合的方法,对于临床诊断和科学研究将起到事半功倍的作用。 目标区域测序,目前常用的是基因芯片技术。其测序原理是基于 DNA 杂交原理,利用目标基因组区域定制的探针与基因组 DNA 进行芯片杂交或溶液杂交,将目标基因区域 DNA 富集,再通过NGS 技术进行测序。其测序过程是通过把数以万计的 cDNA 或寡聚核苷酸置于芯片上制成列阵,将芯片上固定好的已知序列的核苷酸探针与溶液中含有荧光标记的相应核酸序列进行互补配对,根据测序仪所显示强荧光的位置和强度,获取每组点阵列信息,再利用生物信息学算法确定目的靶核苷酸的序列组成。测序所选定的目标区域可以是连续的 DNA 序列,也可以是分布在同一个染色体不同区域或不同染色体上的片段。目标区域测序技术,对于以往通过连锁分析将基因突变锁定在染色体某一片段区域内,但无法找出突变是一个非常好的进一步检测手段。2010 年,Nicholas等使用基因分型芯片联合连锁分析技术,成功发现头小畸形的新基因 WDR62,文章发表在《NatGenet》杂志。类似的研究在家族性胰腺癌中确定 8 个候选变异位点和在家族性渗出性玻璃体视网膜病变发现易感基因TSPAN12。基因芯片测序技术可以将经过连锁分析锁定了目标范围或经过全基因组筛选的特定基因或区域进行更深一层的研究,是解决连锁分析无法发现致病基因的有效手段。基因芯片技术对于已知基因突变的筛查具有明显优势,可以快速、全面地检测出目标基因突变。同时,由于目标区域受到了限制,测序范围大幅度减少,测序时间和费用相应降低。但基因芯片检测所需要的 DNA 的量要大,由于已提取的DNA 存在降解的风险,用于基因芯片研究的血标本最好是冰冻的全血,这样可以使用于检测 DNA 的量有充分保证。 全外显子组测序 (WES) 外显子组是单个个体的基因组DNA 上所有蛋白质编码序列的总合。人类外显子组序列约占人类全部基因组序列的 1%,但大约包含 85% 的致病突变。WES 是利用序列捕获技术将全外显子区域 DNA 捕捉并富集后进行高通量测序的基因分析方法。其捕获的目标区在 34 ~62 M 之间,不仅包括编码区同时也加入了部分非编码区。NGS 的测序过程主要包括DNA 测序文库的制备、锚定桥接、PCR 扩增、单碱基延伸测序和数据分析。研究者根据测序仪捕获到在测序过程中掺入有不同荧光标记碱基片段,经计算机将荧光信号转化成不同颜色的测序峰图和碱基序列。基因测序结果与NCBI的SNP数据库、千人基因组数据库等国际权威数据库比对,最终确定是否为突变基因。自NGS技术问世以来,利用 WES 在临床疾病致病基因的鉴定研究中取得前所未有的成果。这些成果不仅集中在单基因遗传疾病,还在多基因影响的复杂疾病中获得大量相关基因的发现。在单基因遗传性疾病中,如视网膜色素变性、终端骨发育不良等发现新基因或已知基因新突变。在一些罕见的疾病中,如 Kabuki 综合征、家族性混合型低脂血症和脊髓小脑共济失调症等疾病中发现新的致病基因。同时,在小细胞肺癌、慢性淋巴细胞性白血病等肿瘤研究和诸如肥胖症、脑皮质发育不良等复杂疾病的研究中也取得丰硕成果。 |