二代测序RNA建库步骤和原理的详细解释。 一、 核心原理 RNA建库的核心目标是:将种类繁多、稳定性差的RNA分子(主要是mRNA或全RNA)转换为一端连有通用接头、结构均一、可用于Illumina等测序平台进行PCR扩增和测序的DNA文库。 简单来说,这是一个 “RNA → DNA” 的转换和修饰过程。其关键挑战在于: 1. RNA的不稳定性:RNA极易降解,操作需谨慎。 2. RNA的异质性:细胞内RNA种类繁多(mRNA, rRNA, tRNA等),而通常我们只关心占比较少的mRNA(1-5%)。因此,文库构建的核心步骤之一是富集目标RNA(通常是mRNA)。 3. 测序仪的限制:二代测序仪只能对DNA进行测序,因此必须将RNA反转录为更稳定的cDNA。 二、 主要建库类型与流程 根据研究目的,主要有两种建库策略: 1. 普通转录组建库:用于分析基因表达水平。 2. 链特异性建库:除表达水平外,还能保留转录本来源链的信息,对于研究重叠基因、反义转录本等至关重要。 下面以最常用的 “ oligo(dT) 富集mRNA + 链特异性建库” 为例,详细分解其步骤。整个过程可以概括为下图所示的流程: 步骤 1:从总RNA中富集mRNA · 原理:真核生物mRNA的3‘末端带有一段PolyA尾(多个腺嘌呤A)。 利用碱基互补配对原则,使用连在磁珠上的Oligo(dT)探针(一段由胸腺嘧啶T组成的核苷酸链)与PolyA尾特异性结合。 通过磁性分离,洗去rRNA、tRNA等不含PolyA尾的RNA,最后将纯化的mRNA从磁珠上洗脱下来。 · 替代方法:rRNA去除:对于原核生物(其mRNA无PolyA尾)或想保留部分非PolyA RNA的情况,可以使用与rRNA序列互补的探针将rRNA杂交并去除,从而富集剩余的RNA(包括mRNA)。 步骤 2:RNA片段化 · 原理:二代测序仪有最佳读长限制(如150bp)。而mRNA长度从几百到几千碱基不等,必须将其打断成200-500bp的小片段,以保证测序效率和后续组装的可操作性。通常使用金属离子在高温下进行化学片段化。 步骤 3:第一链cDNA合成 · 原理:以片段化的mRNA为模板,使用逆转录酶 和随机引物 或 Oligo(dT)引物,合成第一条互补的DNA链,形成mRNA-cDNA杂交双链。 步骤 4:第二链cDNA合成 · 原理(链特异性核心):移除RNA-cDNA杂交链中的mRNA模板后,以第一链cDNA为模板合成第二链cDNA。 · 在链特异性建库中,此步骤使用 dUTP 来代替dTTP加入反应体系。因此,合成出的第二链cDNA中,所有原本应该为T的位置都被U取代。 · 合成完成后,得到一个双链cDNA 产物,其中第一链是包含T的正常DNA链,第二链是包含U的标记链。 步骤 5:末端修复 & ‘A’尾添加 · 末端修复原理:片段化产生的cDNA末端可能是凹凸不平的。使用特定的酶将DNA末端“修补”成平整末端。 · ‘A’尾添加原理:在修复后的cDNA片段3‘末端添加一个突出的碱基A。因为Illumina测序接头的3’末端带有一个突出的碱基T,这样可以通过 “A-T”互补连接,提高接头连接的效率和特异性。 步骤 6:接头连接 · 原理:将测序接头 连接到cDNA片段的两端。 · 接头是短的、已知的DNA序列,其主要功能包括: 1. 与测序仪流动槽上的互补序列杂交,固定DNA片段。 2. 包含索引/条形码,用于在混合多个样本测序时区分样本来源。 3. 包含与测序引物结合的区域。 步骤 7:链特异性选择与PCR富集 · 原理(链特异性核心): 1. 消化:使用尿嘧啶糖基化酶 处理。该酶能特异性识别并降解含有dUTP的第二链cDNA,而保留不含U的第一链cDNA。 2. PCR富集:经过接头连接和链选择后,仅有第一链cDNA被保留下来。通过PCR扩增,一方面对上一步产物进行富集,以获得足够的测序量。 另一方面,在PCR过程中,使用正常的dNTP(包含dTTP)合成出全新的互补链,最终得到保留了原始RNA链方向信息的双链DNA文库。例如,测序读段与第一链cDNA互补,因此它对应于原始mRNA的反义链。 步骤 8:文库质控与上机测序 · 对最终的文库进行浓度和片段大小分布检测,合格后即可上机进行高通量测序。 三、 关键总结 · 核心转换:RNA → cDNA → 带接头的DNA文库。 · 富集核心:通过Oligo(dT) 或去rRNA 方法富集目标RNA。 · 链特异性核心:通过在第二链合成中引入dUTP,并随后用酶消化含U的链,从而保留链信息。 · 通用步骤:末端修复加A尾和接头连接是几乎所有二代测序文库构建(包括DNA建库)都必需的步骤,目的是让片段化的DNA能与测序接头高效、定向地连接。 |