一、融合基因的定义 融合基因是指两个基因的全部或一部分的序列相互融合为一个新的基因的过程。其有可能是染色体易位、中间缺失或染色体倒置所致的结果。 基因融合是由原本两个独立的基因形成的杂合基因,一般发生在基因组层面,根据融合断点位置的不同,有些基因融合会发生转录有些则不发生转录。 除了基因组上会发生融合外,在转录本层面也会发生基因融合现象;一些基因也会和基因间区发生融合,理论上基因间区断点融合不太可能起作用,但已有研究发现基因间区断点融合是可能被激活的。 二、基因融合检测技术 目前常见的基因融合检测方法包括:荧光原位杂交(FISH)、逆转录聚合酶链式反应(RT-PCR)、免疫组织化学(IHC)、二代测序技术(NGS)等。其他技术平台还有数字PCR,Nanostring等。 1、FISH(荧光标记原位杂交) FISH检测是利用荧光基团标记的DNA探针在组织上原位与样本DNA进行杂交,然后在荧光显微镜下对荧光信号进行计数,以此作为诊断依据的技术。检测基因融合的FISH探针长度一般在400kb-5Mb之间。 2、IHC(免疫组织化学) IHC基于蛋白层面检测基因融合,利用抗原‐抗体特异性结合的原理,通过化学反应使标记抗体的显色剂显色来确定组织细胞内抗原(多肽/蛋白质),对其进行定位、定性及相对定量的检测技术。 RT-PCR可以在RNA水平上高度敏感地检测融合转录本,不过只能检测一些已知的基因融合形式,无法检测未知融合。 这种方法受到RNA质量的影响较大,且患者不同融合的断裂点可能不同,故用传统的PCR直接扩增断裂点是不易实现的。 4、NGS测序 新一代测序检测融合基因主要有全基因组测序(WGS)、转录组测序(RNA-seq)和目标区域靶向(根据靶向富集方法不同又分为杂交捕获和扩增子测序)等技术。 1)DNA测序检测融合基因 在DNA水平上,融合断点位置通常发生在较长的内含子区域,采用WGS对整个基因组进行测序的方法往往成本较高,对于已知融合位点的检测,推荐设计探针去抓取断裂点的目标区域靶向(panel)测序。 ①局限性和挑战 a.融合基因检测要覆盖非常冗长且含有大量重复序列的内含子区域才能准确地找到融合断裂点。 b.高GC含量不利于探针有效捕获目标区域片断。 c.不同基因的内含子含有非常相似的重复序列,这一特征不利于序列准确对比,影响检测准确性。 d.复杂的转录或转录后的剪接加工过程,可能会影响基因的融合。 ②分析策略 a.双端序列配对法(pair-end method) 该方法总体思路是首选将双端序列比对到基因组上,然后评估双端配对序列的距离和方向是否和建库信息一致。 b.断裂序列法(split-read approach) 首选获得唯一比对到基因组上的单端序列,将未能比对上的那部分序列切断,然后重新进行比对,最终获得比对位置和比对方向。 2)RNA测序检测融合基因 ①RNA panel WGS进行融合基因检测,一般要求测序深度30-60X,这对于肿瘤标本的低克隆性融合尤为重要。与之相反,RNA-seq由于只能检测转录和剪接成熟mRNA的基因组区域,因此只能检测到相对高表达的融合。所以根据已知的融合位点,设计特定检测探针,采用靶向捕获DNA或RNA panel测序获得远高于WGS的测序深度,从而可以更敏感的检测出融合基因,因此该技术在临检领域更为适用。 ②优势 相比DNA水平,RNA水平上融合基因表现为前后两个基因外显子之间的衔接,融合点相对固定。这一特征为精准设计探针或引物提供了先天优势。因此,根据融合基因序列特点,在RNA水平上检测融合基因比DNA水平更易实现。 融合基因在RNA水平上“模板”急剧增多,更易检测。在检测融合基因时推荐较长的读长,测序read的长度,还有双端测序read的间隔距离insert size等都会影响基因融合的鉴定效果。 ③分析策略 a.基于序列比对的方法 寻找不一致序列(discordant pair reads)和覆盖断裂点的序列(junction/split reads)从而识别出融合事件。 b.基于拼接比对的方法 首先组装出新的转录本,然后比对到基因组,从而鉴定出与染色体重排一致的融合转录本。 3)基因融合鉴定术语 ①Intact exon (IE) type fusion,是指融合后完整的保留了原来的外显子,未影响原来的外显子结构。 ②Broken exon (BE) type fusion,是指融合后没有保留原来完整的外显子序列。 ③Breakpoint,是指两个融合基因在基因组上发生融合的位置。Spanning read,是指跨越融合位点分别匹配到两个融合基因的paired-end read。 ④Split read,是指恰好匹配到融合位点上的read。Anchor length,是指跨越融合位点的read左端和右端的长度。 ⑤short insert size,一般是指双端测序paired-end sequencing中,两个read中间间隔的较短距离,一般为几百bp。 ⑥long insert size,一般是指双端测序mate-pair sequencing中,两个read中间间隔的较长距离,一般为几kb甚至更长。 参考文献: [1]全面解读融合基因检测:DNA or RNA? PCR or NGS? [2]融合基因(Fusion)主要检测方法-海星生物 [3]#微观探索人体奥秘# 010 基因融合-泛生子 [4]fish检测基因异常的原理及结果判读-复旦大学 [5]一文搞懂基因融合(gene fusion)的定义、产生机制及鉴定方法 [6]癌症的真相之新一代测序下的融合基因分析-生物百科大全 |