金桔
金币
威望
贡献
回帖0
精华
在线时间 小时
|
上一次提到垃圾DNA还是本科的时候洋洋洒洒写的课程小论文,那时候自私的基因还读到上头,还不会查英文文献,至于非编码区的那些类型和功能,还是无聊的一门课上放在提纲里等着考前突击的考点。在大范围基因测序的时代到来后,传统意义上被称为“垃圾DNA(junk DNA)”的那些序列功能已经在被逐渐确定。或者说,我们对基因组的进一步认识,几乎都是在逐步破译这些未知的密码。比如转座子(Transposable Elements)由于在基因组中大量移动与复制,过去被认为是垃圾DNA的一种,而它们现在已经被证明是改变基因表达的顺式调节因子的一种[1]。再比如表观遗传学中涉及大量的非编码RNA来调节蛋白质在翻译过程中的多样性,这一过程大量而复杂的调控因子也在过去被叫作“垃圾DNA”。可见,我们过去以为的垃圾山,只是我们有眼不识泰山罢鸟。
2012年,DNA 元素百科全书 (ENCODE) 项目公布,发现人类细胞中80.4%基因组元素在至少一种细胞类型中具有例如RNA转录、转录因子结合、染色质结构和组蛋白修饰等的生化活性,也就此宣布垃圾DNA这个概念已经消亡。[2]那么,这可以说明基因组中并没有垃圾DNA吗?C值悖论(随着物种复杂度提高,基因组大小并不总是相应提高)的存在依然需要垃圾DNA这个概念支持;生物体和基因组中也存在着大量的功能冗余,作为进化过程中的痕迹或者环境变化的波动,留下了大量沉默或相似的基因片段;而在我们试图阐释基因的功能时,我们依然会发现很多对进化没有正面作用的中性基因被保留在基因组中[3]。而ENCODE公布的这个80%的结果的数字也有着很多水分[4]。比如,和疾病与某些表型的关联性并不能完全证明某些片段有生物功能。尽管越来越多的神秘DNA功能拨云见日,基因组中的功能冗余依然是一个值得探索的课题。
回到我最爱的植物这里吧~黑麦(Secale cereale)的基因组是小麦族物种中最大的基因组之一,它的单倍体基因组(8.0 Gbp/1C)大于被子植物的平均基因组大小(5.6 Gbp),也明显大于它最近的进化邻居(比如小麦5.8–6.1 Gbp)[5]。实验表明,超过 90% 的黑麦基因组由重复 DNA 组成,这是栽培黑麦在其近亲中基因组优势的直接来源。亚端粒区域中的大异色块(Large heterochromatic blocks)是黑麦区别于大麦和小麦这些近亲的代表性染色体特征。就在上世纪末,人们对这些区域的 DNA 组成进行了分析。发现一些串联组织的家族具有极高的单体拷贝数,这些家族总共占整个黑麦基因组的 8-12%。另外,转座元件(TE)是谷物基因组等大型基因组的主要组成部分。在黑麦基因组中,转座子各个家族的成员的几乎可以相互替代。编码区两端具有长末端重复序列(LTR)的反转录转座子存在一种染色体内异位重组机制,即单独的 LTR 或由 LTR 和内部结构域组成串联阵列,这导致如果 LTR 与任何其他 DNA 序列接壤,则 LTR-LTR 重组将在 LTR 旁边生成这些单体的串联阵列。这大大提高了产生重复片段的可能性。这样的的串联 DNA 重复长阵列结构在基因组中是如何产生的无从得知,而在这数千个复制体聚居地附近,不断运行的重组过程影响着邻近的转座子,形成单独的LTR这类的短序列结构……这样的过程很难说是在参与编码、调节或任何有利于生物生存、繁殖或行为相关的过程。因此,更为合理的解释似乎是——这些染色体区域中的DNA所做的只是确保自身生存,这符合“自私DNA”的标准,也符合核基因组中遗传冗余的概念。自然选择并不像以前看起来那么强大,进化过程中遗传的冗余也一直存在。随着我们对基因组的了解越来越清晰,越来越多的“垃圾DNA”被正名,也有黑麦基因组这样的证据,展示着基因组中搭车客“垃圾DNA”们,也依然存在。 |
|