本帖最后由 千年基因 于 2016-8-30 编辑
作为国内三代测序的领导者,千年基因在项目经验和数据质量方面均遥遥领先,读长最长可达50Kb,readsN50高达27Kb,数据产出最高可达2Gb/SMRTCell(详见下表)。为了让更多科研人员体验三代测序的优势,千年基因将尽洪荒之力推出三代测序开学促销,测序价格降至冰点,活动时间为8月20日-10月31日。
千年基因三代测序结果举例:
三代测序在科研领域的应用举例:
1. 三代测序在基因组de novo方向的应用 三代测序的长读长能够更好地跨越基因组高重复序列、转座子区域、大的拷贝数变异区域及结构变异区,可以很好地解决复杂基因组组装难题。对于没有参考基因组的物种,应用三代测序从头进行测序,更完整的基因组可获得更准确的注释信息,从而更有利于发现重要的生物学机制。
案例解析:复活草基因组测序(Nature, 2015.) 1) 研究方法 PacBio平台测序72×数据。 2) 研究结果 组装得到基因组大小244Mb,ContigN50达到2.4Mb,共650条Contig。去除叶绿体、线粒体以及污染序列,共625条Contigs。另外,已公布的植物基因组平均contig N50为50Kb,只有拟南芥(TAIR10)、水稻(V7)以及短柄草(V 2.1)基因组Contig N50比本研究得到的复活草N50更长。组装结果中包括了端粒和着丝粒序列、长末端重复序列、反转录转座子、串联重复基因以及其它难于组装的基因组元件。复活草基因组中重复序列所占比例高达43%,其中共鉴定出3,247个完整的长末端重复(LTRs),属于358个家族,只有~2%重复序列未被注释到分类结果中。预测出28,446个蛋白编码基因,帮助研究人员确定了复活草极端耐旱背后的生物学机制。 图1. 三代测序组装得到的复活草重复区域 3) 参考文献 Robert VanBuren et al. (2016) Single-molecule sequencing of thedesiccationtolerant grass Oropetium thomaeum. Nature.
2. 三代测序在基因组重新组装方面的应用 对于已有参考基因组的物种,应用三代测序重新进行测序,可组装获得更完整的基因组,从而发现更全面的基因组结构信息、功能信息、变异信息等。
案例解析:大猩猩基因组测序(Science, 2016.) 1) 研究方法 72× PacBio 数据构建 Contig,结合 BAC-end 和 Fosmid-end 数据构建Scaffold,使用FALCON软件和已有的Quiver算法进行de novo 组装和纠错。 2) 研究结果 组装得到基因组大小3.1 Gb,Contig N50达到9.6 Mb,Scaffold N50达到23.14Mb。与之前公布的大猩猩基因组(gor Gor3,2012年发表于Nature)组装结果相比,此次组装结果的完整性有显著提升。其中,Contigs数量从原来的433,861减少为16,073,减少了96%;Contig N50从原来的11.6 Kb提升为9.6 Mb,提升了819倍。将本研究组装的序列与已公布的gorGor3版本参考序列进行比对,可以将94%的gap填补好,序列长度增加164Mb,这些增加的序列有助于改善基因组注释,使得又新发现了数千个外显子和调控元件。 表1. 大猩猩基因组组装结果统计
图1. 大猩猩两次基因组组装结果比较 3) 参考文献 David Gordon etal. (2016) Long-read sequence assembly of the gorilla genome. Science.
3. 三代测序在全长转录本研究方面的应用 在转录组研究中,通过三代测序可直接获得全长转录组的序列信息,无需进行拼接,可以获得全面的可变剪切、融合基因以及Isoform信息。
案例解析:玉米全长转录组研究(NatureCommunications, 2016.) 1) 研究方法 file:///C:/Users/MACROG~1/AppData/Local/Temp/msohtmlclip1/01/clip_image002.gif IlluminaHiSeq 2000平台测mRNA,量化gene/isoform的表达; file:///C:/Users/MACROG~1/AppData/Local/Temp/msohtmlclip1/01/clip_image002.gif PacBio RSII平台,P6-C4试剂,Barcoded SMRTBell文库6个构建(<1, 1–2, 2–3, 3–5, 4–6 and 45 Kb),47 SMRT cells,产生3,716,604 reads。 2) 研究结果 file:///C:/Users/MACROG~1/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png 利用单分子测序得来自6个组织的到111151个转录本(约70%注释玉米RefGen_v3基因组); file:///C:/Users/MACROG~1/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png 大部分(57%)转录本为novel,有的是组织特异(tissue-specific),已知基因的同种型(isoforms of known gene),还有3%与novel gene loci匹配; file:///C:/Users/MACROG~1/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png 90%的剪接点(splice junction)由来自匹配组织的short reads组成; file:///C:/Users/MACROG~1/AppData/Local/Temp/msohtmlclip1/01/clip_image001.png 鉴别了大量的新的lncRNA(novel long non-coding RNAs)和融合转录本(fusion transcripts)。 3) 参考文献 Bo Wang et al.(2016) Unveiling the complexity of the maize transcriptome by single-moleculelong-read sequencing. NatureCommunications.
更多文献解析及技术资料请参考千年基因主页: http://www.macrogencn.com/_d277188748.htm
更多详情请致电: 0755-27388725(深圳总部)、010-62111683(北京分部),或发送邮件至info@macrogencn.com,欢迎您的咨询!
|