提到测序,我们会想到什么呢? Sanger测序还是Illumina测序还是华大测序呢,又或者是pacbio或者nanopore?测序可能在我们日常研究课题中非常常见,但是关于测序的入门知识,咱们是否都清楚呢?今天学姐整理了一些关于测序的入门级别知识科普,希望学弟学妹们通过这篇内容能清晰的知道测序的差别。 Sanger测序成为一代测序,测序读长通常为800 bp/次,价格大约10元/次,测序时间大概需要1-2天; Illumina测序和华大MGI测序都是二代测序,在中国大环境下,通常测序读长为双端150 bp(每次测序单次读长为150 bp,但是会正向读取150 bp,反向读取150 bp,因而测序片段的最佳大小为300 bp),价格约为Illumina 20元/Gb,MGI 10元/Gb,测序时间不等,最快一天,最长3天; Pacbio和nanopore通常称为三代测序,测序读长从40 kb到4 M不等/次,三代测序价格差别较大,几千到几万都有可能,看物种基因组大小以及测序类型(de novo或者direct RNA等等),测序时间一般几小时即可完成。 至于测序原理的差异,大家有兴趣自觉补课吧 2、选择一代/二代/三代测序的原则是什么? 如果我们是PCR产物,而且只有几条产物,那么选择一代测序就行(为啥,因为价格便宜。) 如果是需要进行重测序或者RNA测序,那么大多会选择二代测序(还是因为价格便宜)。 如果是PCR产物非常多,或者需要质粒的全长序列,那么二代或者三代测序,看价格选择即可(通常几百元就能搞定)。 如果需要抢时间或者需要做de novo拼接,那么建议测三代。(还是价格便宜么?那肯定不是的,哪那么多便宜占) 3、如果需要二代或者三代测序,怎么开展? 墙裂建议初入门测序的同学们,选择试剂盒厂家购买成品试剂盒即可,很多文献里的建库步骤,现在已经几乎都有了成熟且简单的操作流程,无需我们各种酶体系搭配整的晕乎乎。 需要测序,就选择对应的建库试剂盒以及建库接头即可,按照说明书操作,妥妥的化身建库大神,信手拈来。 4、什么是测序接头? 测序接头是一种为了满足测序仪而准备的序列,一端连接待测序序列,一端连接测序芯片让机器能够识别并开始测序。 测序接头通常包含:测序芯片识别序列、index(区分样本)、index测序引物以及插入序列测序引物。不同的测序平台,测序芯片识别序列、index测序引物以及插入序列测序引物会有差异。 5、一种接头只对应一种测序仪么? 原则上一种接头对应一种测序仪,比如illumina接头只适配illumina测序仪,MGI接头只适配MGI测序仪。 但是也有例外,因为现在测序接头通用的声音越来越多,聪明的人类想到了将接头磷酸化已既适配illumina又适配MGI平台。 另外,不同平台的接头,通过index的组合不同,来区分测序仪上同时测序的样本。 6、barcode是啥? barcode即index,illumina平台一般称为index,MGI平台称为barcode。 7、标签跳跃是什么? 从A文库不小心混到了B文库上后,黏连到B文库上,被进行扩增后,放大了错误的标签信号。 8、高GC区域测序,哪个测序平台更好? 目前大家都差不多,都有些问题。 9、测序选择Illumina还是MGI,哪种好? 测序效果一样,看个人选择。 10、不同公司的测序结果,能合并一起分析么? Illumina和MGI可以合并没关系,但是同一项目不建议分测序平台,最好在分析前先做批次校正Combat后,再合并分析。 同一公司送样,也需要批次校正,因为用的试剂盒也不一样。涉及到定性,可以不用批次验证,但是如果需要定量,那么需要批次验证。 Pacbio和nanopore不能合并。 11、MGI环化会受到影响,但是什么区域会影响环化效率? 环化成功率低是MGI的缺陷,大片段(超过1kb等)环化成功率低,其他影响因素不确定。 12、测序数据量怎么确定? 线粒体、叶绿体、质粒等小的DNA,一般测3代,动植物大基因组,一般60-100x,微生物一般也测三代,基因组太小。 转录组测序深度要求20 M的reads paried,6G左右,像小麦一般测10-12G。 13、raw data和clean data的差异? Raw data一般指下机数据,clean data一般指过滤掉低测序质量的数据。 14、测序时,不同的文库扩增效率和GC含量不同,会影响测序结果? GC含量过高、过低,扩增效率都会低,与PCR扩增时,退火温度等都有关。代表性的是昆虫线粒体,有一段AT富集区,正常PCR扩增时,完全测不到。 15、公司测序数据如何判断数据好坏? 根据数据质量值Q20、Q30,一般至少需要大于90。 16、测序模式如何选择? 首选,常规文库,国内一般选择PE150,测序价格最便宜,只有一些单细胞、扩增子等测序策略有差别。 17、为什么不同的文库,测序深度不同? 因测序长度的限制,DNA测序时,是有可能在某些位置上没有覆盖到,这时,需要加大测序深度以减少未测到区域的概率。不同的文库,生信分析时,要求的片段区域的覆盖度不一样。 18、测序时,有没有可能遗漏了测序区域 测序量低,就可能出现。 关于测序相关内容,大家还想了解什么呢?把想知道的留言,下期可能就更新相关内容啦~ |