Illumina 测序仪 Illumina公司的新一代测序仪Genome Analyzer最早由Solexa公司研发,利用其专利核心技术“DNA簇”和“可逆性末端终结(reversible terminator)”,实现自动化样本制备及基因组数百万个碱基大规模平行测序。Illumina公司于2007年花费6亿美金的巨资收购了Solexa,就是为了促成Genome Analyzer的商品化。Genome Analyzer作为新一代测序技术平台,具有高准确性,高通量,高灵敏度,和低运行成本等突出优势,可以同时完成传统基因组学研究(测序和注释)以及功能基因组学 (基因表达及调控,基因功能,蛋白/核酸相互作用)研究。
Genome Analyzer自上市以来,已经为千人基因组计划立下了赫赫战功。今年早期,荷兰科学家利用它首次绘出女性的基因组图谱。而就在前两周,《Nature》杂志上一连出现三个人类基因组图谱:炎黄一号-第一个亚洲人图谱;第一个癌症病人图谱;第一个非洲人图谱。它们全是依赖Genome Analyzer完成的。哗,一下就来仨!这和第一个人类基因组图谱的13年形成了多么鲜明的对照。 根据去年底的数据,Genome Analyzer已售出约200台,估计是市场占有率最广的。前不久,华大基因再添置了12台,准备放在香港和深圳的实验室,至此华大基因已经有29台Genome Analyzer。而著名的麻省理工学院和哈佛大学Broad研究院拥有47台Illumina测序仪。众多实验室之所以选择Illumina,看中的无疑是Genome Analyzer的高性价比。
上个月,Illumina将Genome Analyzer II升级到Genome Analyzer IIx,距年底实现单次运行获得95 GB数据的宏伟目标又近了一步。Genome Analyzer IIx有两个核心特征:其一是更大的试剂冷却器,支持超过100个测序循环,进一步提升了系统的易用性和自动化;其二是全新的流动池支架,让每轮运行所得的高质量数据增加20%。依靠系统软件和试剂的改进,Genome Analyzer IIx现在能够支持100 bp以上的配对末端读长,并在每次运行中产生超过20 GB的高质量数据。
Genome Analyzer技术的基本原理:
1. 文库制备
将基因组DNA打成几百个碱基(或更短)的小片段,在片段的两个末端加上接头(adapter)。
2. 产生DNA簇
利用专利的芯片,其表面连接有一层单链引物,DNA片段变成单链后通过与芯片表面的引物碱基互补被一端“固定”在芯片上。另外一端(5’或3’)随机和附近的另外一个引物互补,也被“固定”住,形成“桥 (bridge) “。反复30轮扩增,每个单分子得到了1000倍扩增,成为单克隆DNA簇。DNA簇产生之后,扩增子被线性化,测序引物随后杂交在目标区域一侧的通用序列上。
3. 测序
Genome Analyzer系统应用了边合成边测序(Sequencing By Synthesis)的原理。加入改造过的DNA聚合酶和带有4种荧光标记的dNTP。 这些核苷酸是“可逆终止子”,因为3’羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。目前的配对末端读长可达到2×50 bp,更长的读长也能实现,但错误率会增高。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。
4. 数据分析
自动读取碱基,数据被转移到自动分析通道进行二次分析。 Genome Analyzer系统之所以如此畅销,关键在于其技术上的优势。
1. 可扩展的超高通量
Genome Analyzer系统目前每次运行后可获得超过20 GB的高品质过滤数据。这个技术的可扩展性保证了更高的数据密度和输出,能用更少的经费完成更复杂的项目。到今年底,通量还有望上升到95 GB,相当于人类基因组的30倍覆盖度。
2. 需要样品量少
Genome Analyzer系统需要的样品量低至100ng,能应用在很多样品有限的实验(比如免疫沉淀、显微切割等)中。这也是很多研究人员所考虑的因素。
3. 简单、快速、自动化
Genome Analyzer系统提供了最简单和简洁的工作流程。即使是最小的实验室也能像大型基因组中心一样进行大规模的实验。制备样品文库可以在几小时内完成,一个星期内就能得到高精确度的数据。Cluster Station可以说是Genome Analyzer的核心。由独立软件控制的自动生成DNA簇的过程可以在5小时之内(30分钟手工操作)完成。这个自动化的流程不需要进行Emulsion PCR,减少了手工操作误差和污染可能性,也不需要机器人操作或洁净室。快速的实验流程使Genome Analyzer的能力增至最大,而自动化步移降低了项目的时间和费用。
4. 新颖的测序化学技术
Genome Analyzer通过合成测序来支持大规模并行测序。利用新颖的可逆荧光标记终止子,可以在DNA链延伸的过程中检测单个碱基掺入。由于四个可逆终止子dNTP在每个测序循环都存在,自然的竞争减少了掺入的误差。
5. 单个或配对末端支持
Genome Analyzer系统支持单个片段或配对末端文库。文库构建过程简单,减少了样品分离和制备的时间。制备基因组DNA的单个片段或配对末端文库需要6个小时,只有3个小时需要手工操作。2×50个碱基或更长的读长增加了比对基因组的能力,并拓展了在其他方面的应用。
然而,精明的用户更看重的是性价比,这也是他们选择Illumina的重要原因。Illumina的售价约为45万美元,低于454 GS FLX的50万和SOLiD系统的59万(以上皆为美国的售价)。此外,运行成本也是一个关键因素。美国凤凰城翻译基因组学研究院(TGen)的主管David Duggan曾表示,当年购买新一代测序仪时,每次运行的费用就成为他下决定的主要因素。他最终选择了Illumina Genome Analyzer,因为每轮的运行费用为3000-4000美元(2007年的数据),较为合理,而其他测序仪可能更高。当然,他也综合考虑了通量、运行时间和样品量。
弗吉尼亚联邦大学的高原(音译)博士认为:“Genome Analyzer的操作费用、易用性和可扩展性让我实现了大规模基因组实验。现在,我的小型实验室正在进行过去只能在大型基因组中心才能完成的实验。低样品需求、简单的流程、高质量的数据以及应用灵活性让Illumina Genome Analyzer从其他高通量测序技术中脱颖而出。”
ROCH-454 测序仪 454公司可谓新一代测序技术的奠基人。2005年底,454公司推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统——Genome Sequencer 20 System,被《Nature》杂志以里程碑事件报道,开创了边合成边测序(sequencing-by-synthesis)的先河。之后,454公司被罗氏诊断公司以1.55亿美元收购。一年后,他们又推出了性能更优的第二代基因组测序系统—— Genome Sequencer FLX System (GS FLX)。去年10月,全新的GS FLX Titanium系列试剂和软件的补充,让GS FLX的通量一下子提高了5倍,准确性、读长也进一步提升。
想当年,GS 20的出现,揭开了测序历史上崭新的一页。Jonathan Rothberg博士就是大规模并行测序的发明者,同时也是454的创始人。上世纪90年代,很多学者也都想到了大规模并行测序,他们试图将Sanger测序移到芯片上,但都以失败告终,因为这项技术没有可扩展性。1999年,Rothberg的儿子出世,他放了两个星期的陪产假。小家伙出生后被送入婴儿特护病房,Rothberg非常担心,甚至想获取儿子的基因组信息。这段担惊受怕的经历给了他灵感,他突然意识到焦磷酸测序(pyrosequencing)不仅简单,而且具有可扩展性。两个星期之后,Rothberg就开始设计芯片和流动室,让测序在更小的反应室中进行,并同时进行几百万个反应。 硬件的设计和制造也只是成功的一半,在样品制备上还有同样漫长的路要走。Rothberg摒弃了传统的细菌克隆与挑选,将DNA打断成随机片段,并寻找一种方法来克隆每个片段。受到其他学者乳液实验的启发,他也想将DNA放入油包水的乳液中,这样就省去了反应管。一个好汉三个帮。在Joel Bader等人的帮助下,Rothberg验证了这些想法的可行性,并利用了炸药中的表面活性剂来维持乳液的热稳定性。就这样,乳液PCR终于诞生了。
之后,454生命科学公司用新一代测序仪对DNA双螺旋结构的发明者James Watson进行了基因组测序。第一份个人基因组图谱的绘制只用了两年时间,花费不到100万美元。虽然现在看来这并不算什么,但就当时而言,它相对于人类基因组计划已是质的飞跃。
GS FLX系统的工作流程
GS FLX系统的流程概括起来,就是“一个片段 = 一个磁珠 = 一条读长(One fragment = One bead = One read)”。
1)样品输入并片段化:GS FLX系统支持各种不同来源的样品,包括基因组DNA、PCR产物、BAC、cDNA、小分子RNA等等。大的样品例如基因组DNA或者BAC等被打断成300-800 bp的片段;对于小分子的非编码RNA或者PCR扩增产物,这一步则不需要。短的PCR产物则可以直接跳到步骤3)。
2)文库制备:借助一系列标准的分子生物学技术,将A和B接头(3’和5’端具有特异性)连接到DNA片段上。接头也将用于后续的纯化,扩增和测序步骤。具有A、B接头的单链DNA片段组成了样品文库。
3)一个DNA片段=一个磁珠:单链DNA文库被固定在特别设计的DNA捕获磁珠上。每一个磁珠携带了一个独特的单链DNA片段。磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,这样就形成了只包含一个磁珠和一个独特片段的微反应器。
4)乳液PCR扩增:每个独特的片段在自己的微反应器里进行独立的扩增,而没有其他的竞争性或者污染性序列的影响。整个片段文库的扩增平行进行。对于每一个片段而言,扩增后产生了几百万个相同的拷贝。随后,乳液混合物被打破,扩增的片段仍然结合在磁珠上。
5)一个磁珠=一条读长:携带DNA的捕获磁珠随后放入PTP板中进行后继的测序。PTP孔的直径(29um)只能容纳一个磁珠(20um)。然后将PTP板放置在GS FLX中,测序开始。放置在四个单独的试剂瓶里的四种碱基,依照T、A、C、G的顺序依次循环进入PTP板,每次只进入一个碱基。如果发生碱基配对,就会释放一个焦磷酸。这个焦磷酸在ATP硫酸化酶和萤光素酶的作用下,经过一个合成反应和一个化学发光反应,最终将萤光素氧化成氧化萤光素,同时释放出光信号。此反应释放出的光信号实时被仪器配置的高灵敏度CCD捕获到。有一个碱基和测序模板进行配对,就会捕获到一分子的光信号;由此一一对应,就可以准确、快速地确定待测模板的碱基序列。这也就是大名鼎鼎的焦磷酸测序。
6)数据分析:GS FLX系统在10小时的运行当中可获得100多万个读长,读取超过4-6亿个碱基信息。GS FLX 系统提供两种不同的生物信息学工具对测序数据进行分析,适用于不同的应用:达400 MB的从头拼接和任何大小基因组的重测序。
GS FLX系统的准确率在99%以上。其主要限制来自同聚物,也就是相同碱基的连续掺入,如AAA或GGG。由于没有终止元件来阻止单个循环的连续掺入,同聚物的长度就需要从信号强度中推断出来。这个过程就可能产生误差。因此,454测序平台的主要错误类型是插入-缺失,而不是替换。 新升级让性能全面提升
去年底发布的Titanium系列试剂,是对现有GS FLX平台的重要升级。升级内容包含耗材、试剂和软件。你无需对仪器的硬件做任何昂贵的升级,只改进试剂和软件,就能立刻实现性能提升。升级之后,每轮测序能产生100万个读长片段,高质量(Q20)的读长增加至400 bp。第400个碱基的准确率是99%,之前的更高。通量也提高了5倍,目前每轮运行能获得4-6亿个碱基对,所需时间为10小时。
- PTP平板的创新重设计 重新设计之后,PTP平板上孔的密度更高,利用更小的DNA捕获磁珠进行金属覆盖,改善了信号质量,因此读长的数量和长度都明显改善,同时准确性更高。目前孔的直径是29 um,DNA捕获磁珠的大小是20 um。
- 改进的测序试剂 改进的GS FLX Titanium试剂显著降低了背景噪音,因此在几乎相同的运行时间内,读长更加长。
- 升级的软件 优化用于超高通量测序的软件,能轻松对更大、更复杂的基因组进行拼接和作图。
- GS FLX 2.0版 它与以前版本的输出数据也完全兼容,让片段能够共同拼接和作图。
广阔的应用天地
在新一代测序技术中,GS系统是最多产的。截至2008年9月,已经发表了250多篇高质量的paper。其中Nature 20篇、Science 13篇、Cell 6篇、Genome Research 20篇、PNAS 24篇。光是这些数据就让人咂舌。这些研究跨越了测序应用的多个方面:82篇全基因组测序论文包括比较基因组学的从头测序和重测序;54篇小分子RNA研究;37篇聚焦快速兴起的宏基因组学;27篇关于转录组图谱分析,包括全转录组拼接和表达图谱;13篇研究染色体结构和表观遗传学;10篇有关稀有变异检测的超深度测序这个新领域;11篇研究古老RNA。其余的文章关注454测序系统的技术和生物信息学。多种多样的应用彰显出454测序系统的能力,那些传统意义上无法用测序来解决的问题现在也一并解决了。
454测序系统除了为多项研究领域开辟了基因组分析之路,同时也加速了探索的步伐。一般来说,研究、分析、撰写并提交论文,经同行评议后发表,需要一年左右的时间。而利用Genome Sequencer系统发表论文的速度,显然表明454测序结果的数据质量高,且分析简单。超长读长与易用的分析工具相结合,让研究人员能更集中精力于科学研究,而不是研究测序过程中的某个技术细节。这样研究项目能快速完成,接着踏上新的研究道路。
与其他新一代测序平台相比,454平台的突出优势是读长。目前GS FLX系统的序列读长已超过400 bp。虽然454平台的测序成本比其他平台要高很多,不过对于那些需要长读长的应用,如从头拼接和宏基因组学,它仍是最理想的选择。
去年底,美国加利福尼亚大学的研究小组利用全新的GS FLX Titanium系列试剂对海洋样品的宏基因组进行测序,发现了一种全新的蓝藻物种,文章发表在11月14日的《Science》杂志上。这项研究是系统升级后发表的首篇文章。首席研究员Jonathan Zehr对于获得数据及分析结果的速度非常震惊。他表示:“多年来我们一直试图培养这种微生物,但都没有成功。有了GS FLX Titanium,我们在几天之内就通过单次测序运行,从环境样品直接获得了宝贵的基因组信息。这个系统超长的读长对于我们从复杂的微生物群体中鉴定并分析这种独特的细菌基因组来说非常关键。”
最近,在454测序平台的协助下,研究人员完成了油棕榈的全基因组测序、拼接和注释。油棕榈是一种重要的经济作物,它的基因组很大,达17 GB。基因组的测序工作是由GS FLX Titanium系统完成的,拼接和分析则是由马来西亚一家生物信息学公司完成的。值得注意的是,这是史上第一次在没有添加传统Sanger测序数据的情况下,完成了对大且非常复杂的植物基因组进行从头拼接。这种快速经济的方法为了解多种经济作物的遗传结构打开了大门。
此外,罗氏旗下的另一家公司NimbleGen正在全球性地捕获定向重测序市场。NimbleGen序列捕获芯片与454的测序仪结合,能让完整的人外显组测序成为现实,最终将为研究流水线输送技术,并促进个性化医疗的开发. ABI测序仪 过去20年,美国应用生物系统公司(ABI)在测序方面一直占据着垄断地位。自公司的共同创始人Leroy Hood在上世纪80年代中期设计了第一台自动荧光测序仪之后,生命科学研究就摆脱了手工测序的繁琐和辛劳,骄傲地迈入自动测序的新时代。直到2005年,454推出了FLX焦磷酸测序平台,ABI的领先地位开始有些动摇。之后,ABI迅速收购了一家测序公司——Agencourt Personal Genomics,并在2007年底推出了SOLiD 新一代测序平台。从SOLiD到如今的SOLiD 3,短短一年多时间,它已经上演了一出精彩的“一级方程式赛车”。
SOLiD全称为supported oligo ligation detetion,它的独特之处在于以四色荧光标记寡核苷酸的连续连接合成为基础,取代了传统的聚合酶连接反应,可对单拷贝DNA片段进行大规模扩增和高通量并行测序。就通量而言,SOLiD 3系统是革命性的,目前SOLiD 3单次运行可产生50GB的序列数据,相当于17倍人类基因组覆盖度。而其无以伦比的准确性、系统可靠性和可扩展性更让它从其他新一代测序平台中脱颖而出。为什么SOLiD能轻松实现貌似不可能的任务?让生物通带你从测序原理入手,一探究竟。 SOLiD工作流程
a. 文库制备
SOLiD系统能支持两种测序模板:片段文库(fragment library)或配对末端文库(mate-paired library)。使用哪一种文库取决于你的应用及需要的信息。片段文库就是将基因组DNA打断,两头加上接头,制成文库。如果你想要做转录组测序、RNA定量、miRNA探索、重测序、3’, 5’-RACE、甲基化分析、ChIP测序等,就可以用它。如果你的应用是全基因组测序、SNP分析、结构重排/拷贝数,则需要用配对末端文库。配对末端文库是将基因组DNA打断后,与中间接头连接,再环化,然后用EcoP15酶切,使中间接头两端各有27bp的碱基,再加上两端的接头,形成文库。
b. 乳液PCR/微珠富集
在微反应器中加入测序模板、PCR反应元件、微珠和引物,进行乳液PCR(Emulsion PCR)。PCR完成之后,变性模板,富集带有延伸模板的微珠,去除多余的微珠。微珠上的模板经过3’修饰,可以与玻片共价结合。看到这里,是不是有一种似曾相识的感觉呢?那就对了,此步骤与454的GS FLX基本相同。不过SOLiD系统的微珠要小得多,只有1 um。
乳液PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。
c. 微珠沉积
3’修饰的微珠沉积在一块玻片上。在微珠上样的过程中,沉积小室将每张玻片分成1个、4个或8个测序区域。SOLiD系统最大的优点就是每张玻片能容纳更高密度的微珠,在同一系统中轻松实现更高的通量。
d. 连接测序
这一步可就是SOLiD的独门秘笈了。它的独特之处在于没有采用惯常的聚合酶,而用了连接酶。SOLiD连接反应的底物是8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。探针的5’末端分别标记了CY5、Texas Red、CY3、6-FAM这4种颜色的荧光染料。探针3’端1~5位为随机碱基,可以是ATCG四种碱基中的任何一种碱基,其中第1、2位构成的碱基对是表征探针染料类型的编码区,下图的双碱基编码矩阵规定了该编码区16种碱基对和4种探针颜色的对应关系,而3~5位的“n”表示随机碱基,6~8位的“z”指的是可以和任何碱基配对的特殊碱基。
单向SOLiD测序包括五轮测序反应,每轮测序反应含有多次连接反应。第一轮测序的第一次连接反应由连接引物“n”介导,由于每个磁珠只含有均质单链DNA模板,所以这次连接反应掺入一种8碱基荧光探针,SOLiD测序仪记录下探针第1、2位编码区颜色信息,随后的化学处理断裂探针3’端第5、6位碱基间的化学键,并除去6~8位碱基及5’末端荧光基团,暴露探针第5位碱基5’磷酸,为下一次连接反应作准备。因为第一次连接反应使合成链多了5个碱基,所以第二次连接反应得到模板上第6、7位碱基序列的颜色信息,而第三次连接反应得到的是第11、12位碱基序列的颜色信息……
几个循环之后,引物重置,开始第二轮的测序。由于第二轮连接引物n-1比第一轮错开一位,所以第二轮得到以0,1位起始的若干碱基对的颜色信息。五轮测序反应反应后,按照第0、1位,第1、2位... …的顺序把对应于模板序列的颜色信息连起来,就得到由“0,1,2,3…”组成的SOLiD原始颜色序列。 e. 数据分析
SOLiD测序完成后,获得了由颜色编码组成的SOLiD原始序列。理论上来说,按照“双碱基编码矩阵”,只要知道所测DNA序列中任何一个位置的碱基类型,就可以将SOLiD原始颜色序列“解码”成碱基序列。但由于双碱基编码规则中双碱基与颜色信息的简并特性(一种颜色对应4种碱基对),前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一个错误颜色编码就会引起“连锁解码错误”,改变错误颜色编码之后的所有碱基。
和其它所有测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。由于SOLiD系统采用了双碱基编码技术,在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。这样,双保险确保了SOLiD系统原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前新一代基因分析技术中准确度最高的。
为避免“连锁解码错误”的发生,SOLiD数据分析软件不直接将SOLiD原始颜色序列解码成碱基序列,而是依靠reference序列进行后续数据分析。SOLiD序列分析软件首先根据“双碱基编码矩阵”把reference碱基序列转换成颜色编码序列,然后与SOLiD原始颜色序列进行比较,来获得SOLiD原始颜色序列在reference的位置,及两者的匹配性信息。Reference转换而成的颜色编码序列和SOLiD原始序列的不完全匹配主要有两种情况:“单颜色不匹配”和“两连续颜色不匹配”。由于每个碱基都被独立地检测两次,且SNP位点将改变连续的两个颜色编码,所以一般情况下SOLiD将单颜色不匹配处理成测序错误,这样一来,SOLiD分析软件就完成了该测序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错误,SOLiD分析软件将综合考虑该位置颜色序列的一致性及质量值来判断该位点是否为SNP。
在初步了解了SOLiD系统的工作原理之后,我们才能明白它的魅力所在。
系统可扩展性
SOLiD系统采用开放玻片式的结构,使用包被DNA样品的微珠来输入基因组信息。微珠密度并不是一成不变的,系统支持更高密度的微珠富集。开放式玻片形式、微珠富集、以及软件算法的结合,能使平台轻松升级到更高的通量,而无需对基础技术和配置做重大改变。这也是SOLiD系统平均每季度将通量扩大一倍的原因所在。
无以伦比的通量
目前SOLiD 3系统单次运行能产生50 GB的人基因组序列数据,相当于基因组的17倍覆盖度,这显然是其他任一台新一代测序系统都无法达到的。今年初,ABI公司和贝勒医学院人类基因组测序中心(HGSC)的科学家总结了他们在千人基因组计划首次数据发布中的贡献。作为商业参与者以及与HGSC共同协作,ABI公司利用SOLiD系统产生了超过460 GB可作图的序列数据,比这两个机构的预定目标高出了65%。而通量的升高也有望进一步降低基因组测序的费用,成本只需1万美元的人类基因组测序指日可待。
最大的灵活性
SOLiD 3系统具有两个独立的流动室,让用户能在一台SOLiD分析仪中运行两个完全独立的实验——同时提供两套仪器。玻片也能分成1个、4个或8个小室。而20个条形码序列则提供了额外的灵活性,显著增加了定向重测序、表达和ChIP分析的经济性。目前最多能同时运行320个样品(2×8×20)。
至此,SOLiD系统已不再是一台单纯的测序仪,而是成为功能更全面的基因分析仪。除了测序和重测序,还能进行全基因表达图谱分析、SNP、microRNA、ChIP、甲基化等多种分析。
全基因表达图谱分析
芯片大概是目前应用最广泛的从全局角度分析基因表达整体模式的方法。然而,基于杂交技术的微阵列技术只限用于已知序列,无法检测新的mRNA;而且杂交技术灵敏度有限,难以检测低丰度的目标(需要更多的样品量),难以检测重复序列;也无法捕捉到目的基因表达水平的微小变化------而这恰恰是研究在刺激下或环境变化时的生物反应所必需的。
与芯片技术相比,基于测序的高灵敏SOLiD技术可对单个细胞和癌症样品中存在的痕量RNA进行整体的全基因组表达图谱分析,每次运行能定位高达2亿4千万个标签(mRNA的相对表达水平可通过系统产生的序列标签数目来计算),可检测低至每个细胞中10-40pg的总RNA,即使mRNA表达水平很低,SOLiD系统也能够无偏向性地分析样品中存在的已知和未知mRNA,从而定量特定mRNA的差异表达模式。起始样品比微阵列技术要少得多,尤其适用于来源极为有限的生物样品分析,如癌症干细胞----分析其基因和非编码RNA的表达图谱有助于有助于加速发掘潜在的生物标志物,从而更准确区分不同的疾病类型以及识别疾病易感性,帮助于研究人员更好地了解病变细胞的特性。
更多RNA研究
除了单细胞基因表达图谱分析,SOLiD系统在RNA方面的其他应用还包括利用SOLiD Small RNA Expression Kit来发现和筛选小分子RNA,实现在无需预先知道序列信息的情况下高通量发现新的RNA分子。这个方案有望显著地提高研究人员鉴别小分子RNA的能力,将过去不可能完成的实验变为可能。目前已发现的microRNAs还非常有限,SOLiD可在不知道目标分子DNA序列的情况下进行检测和定量小的RNA分子,可将样品制备工作从常规方法的四天缩短为仅需一天,是分析在生物样品中表达的已知和未知miRNA及其它小分子RNAs的有效工具。利用SOLiD Whole Transcriptome Kit还可以探索和鉴定全转录本。SOLiD无可比拟的高通量和测序数据的高精确性使得可以用短序列读长即可测序整个转录组。了解转录组对有助于解开导致复杂疾病的分子通路的秘密。这一系列应用补充使研究人员能在单个超高通量平台上开展综合的RNA研究。
SNP分析
尽管绝大多数的人类遗传信息在所有人中都相同,但是研究人员通常更感兴趣的是研究个体之间微小的遗传差异。这种差异包括单碱基变异,以及被称为结构变异的各种较大片段DNA序列变异。结构变异包括DNA片段的插入、缺失、倒位和易位,结构变异的DNA片段范围可从几个碱基对到数百万个碱基对,可能对基因产生重要影响,并导致人类疾病的发生。SOLiD流程获得的严密的片段范围,使研究人员可以鉴别出很宽范围内的插入和缺失片段,结构重排也能很容易鉴别出来。这个平台的超高通量使研究人员可轻而易举地获得高度基因组覆盖率的数据,精确鉴定个体基因组中存在的数百万个单碱基多态性SNP,揭示大量此前未知、具有潜在医学价值的遗传变异,从而促进我们对正常/疾病状态下DNA结构变异的了解,以及在更高的分辨率下对结构变异进行深入分析,解释个体之间的易感性差异和对疾病治疗应答的差异,最终实现个性化医疗。
甲基化分析
甲基化是自然发生的DNA化学修饰的一种。已知抑癌基因的失活与DNA序列特定区域的甲基化有关。而去甲基化则可能导致基因组不稳定和表达模式变化。DNA甲基化区域可能作为基因在癌症过程中的标记。研究人员一直致力研究从正常到癌变过程中甲基化模式如何变化的,原癌基因异常甲基化模式在癌变过程中扮演怎样的角色。SOLiD系统运行通量非常惊人,很快就可以做多个样本全基因组甲基化模式检测,使得研究人员可以鉴别基因组中对应元件的甲基化状态,从而帮助研究人员检测甲基化模式是否可以作为癌症的生物标识,以及更好了解甲基化在癌变过程中扮演的角色。 |