金桔
金币
威望
贡献
回帖0
精华
在线时间 小时
|
对不同群体、不同个体、不同细胞,进行DNA测序、RNA 测序,那自然是没完没了的
但是参考基因组测序为啥没完没了,可以讨论一下
@Tang Boyun 给了已发表的动物参考基因组列表,我刚在专栏《生信笔记》里整理了 2000年至今发表的所有植物参考基因组,一共 335个
张旭东:2000 - 2018,335个已发表植物基因组汇总
从 10年的 5 个到 17年69个,今年已经发表了 68 个,还会增加
12年左右,测序物种迅速增多,主要是二代测序成熟的结果。但是现在想想,这么多物种被测序,尤其是很多不那么重要的物种,每个至少 200万起步,很多人质疑是不值得的。得到的不是染色体水平的序列,只是几百甚至几千条 scaffold。不客气的说,很多基因组都是垃圾,没啥用。
到了15年,这种水平的文章已经很难发表了,所以你看到只有 24 个。也许这背后还有很多没发表出来,或者决定补测三代数据。
到了16年,PacBio 开始大量应用到动植物基因组组装(之前价格贵,主要要用在小基因组);17年、18年NanoPore 技术成熟;再加上光学图谱、Hi-C 。可以说所有所有物种都能被组装到染色体水平了。
这个时候,再回头看看当年拼接出来的“垃圾”,简直不能忍,所以第一波测过的物种又被拉出来重新测序,注意是完全重做,不是修修补补。这就是你看到的这两年的第二波高潮。
你比如苹果的基因组,一共三个版本
你比较一下前两个版本和 2017年版本的N50,就知道之前的是不是垃圾,就知道为啥都第三次了,还能发到 NG 。
以上是数据,我们预测一下未来
- 未来的两三年,这个高潮还将持续,所有重要物种的参考基因组都会被测序或者重新测序,而且都能发高水平的文章。
- 这波高潮过了就过了,短期内没有下一波。因为这波的基因组都装到了染色体水平,修修补补就可以了,没有必要推倒重来。就像人的基因组,只是修修补补。
|
|