立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 78|回复: 5

[分享] 基因测序 20 年后,终于搞清了垃圾 DNA 是干啥的!?

[复制链接]
发表于 2024-12-19 16:11 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2024-12-19 16:12 | 显示全部楼层
这问题非常不专业,也非常过时. 搞得好像50年前的问题,提问者是高中生吗?
首先assume human genome 联系到genome composition,1% exon,但是intron加起来可不小,差不多genome一半是genomic region.
为什么不能全是exon? 你的电脑里全是数据没有exe文件? 假设一下全是exon,就变成细菌的genome,非常fragile,变几个base功能就完全不一样了,细菌mechanism没那么复杂死不了,你可就不一定了,某些hormone增加个几成就够你受的,而且真核gene model很复杂,一个基因一般有不同表达. 很多需要alternative splicing.
在genomic region外面,有调控的transcription factors,和methylation有关的cpg之类的, 也有很多比如telomere centromere之类和cell cycle和division强相关的区域,注意chromosome不仅仅是序列,也是化学分子
最后有一些“selfish sequence” 比如interspersed elements,类似加沙这些基因喜欢下崽崽,管不了它们,
回复 支持 反对

使用道具 举报

发表于 2024-12-19 16:13 | 显示全部楼层
一般科幻小说是这么写的:
某种史前文明为了保存某种重要信息,希望发明一种信息载体,但是纸墨褪色石头风化,然后他们发明了一种可以自我迭代更新的有机载体,信息加密做成有机编码包,然后加上自我复制构造的代码片段,就是完整的DNA……所以没有的部分才是核心,有用的只是工具
回复 支持 反对

使用道具 举报

发表于 2024-12-19 16:13 | 显示全部楼层
不完全如此。人类基因组里约 90% 的序列看起来真的符合“垃圾 DNA”的描述。
历史上,一部分学者将没有功能或对生物体的健康没有积极影响的 DNA 描述为“垃圾 DNA”,他们对“没有功能”的标准不一。近年来,这造成了许多混乱:

  • 一些研究发现了一些非编码序列的功能,媒体将其报道为“垃圾 DNA 原来有这样那样的作用”。但是,“一些非编码序列有功能”是已有数十年历史的理论,“垃圾 DNA”不是指“所有的非编码序列”;
  • 一些研究发现特定的未参与调控基因表达的非编码序列在发生特定的突变后可以干扰基因表达,媒体也将其报道为“垃圾 DNA 原来有这样那样的作用”。但是,在实验动物身上将这样的非编码序列删掉不会引起这样的干扰。
  • 看起来,人类基因组里编码蛋白质或对其进行各种调控的序列、以转录出的 RNA 发挥功能的序列加起来不到基因组全长的 10%,已经解析出具体功能的部分不到基因组全长的 6%,而媒体的报道经常让读者以为“垃圾 DNA 全都有用或至少大半有用”。
2012 年,DNA 元件百科全书(ENCODE)项目的研究人员用宽泛的定义(生物化学功能,能转录成 RNA、能结合组蛋白、涉及脱氧核糖核酸酶Ⅰ等全都算“功能”)宣布人类基因组约 80% 的部分有功能,这之中大多数功能序列既不编码蛋白质又不调控基因表达。
2017 年,Dan Graur 的计算显示,人类基因组中至少 75% 的序列不应该有直接的功能。
Graur 综合考虑了物种传代过程中面临的有害突变的风险性、人类历史进程中已知的人口稳定度和繁殖率,计算显示,假设人类基因组 100% 具有功能,按照现在知道的有害突变率范围,每对夫妇平均而言要生育 24 个以上的孩子,才能有 2 个孩子健康存活。这显然是不可能的。

  • 如果人类基因组 80% 具有功能,那么每对夫妇平均需要生育 15 个孩子,才能有 2 个孩子健康存活。
  • 当然,如果那所谓“功能”其实特别低效和次要,那么突变的危害也会缓解。
2022 年,一项研究对来自英国的 150119 人的基因组进行了测序,最终数据库包含来自 149960 个人的基因组序列,检测到 585040410 处 SNP、58707036 处短插入缺失,发现这些突变在基因组里的分布明显不均匀[1]:



  • 外显子和其附近的调控序列的突变明显少于全序列平均水平。无功能区域的突变较多。突变最少的序列约有 13% 是外显子,其余是非编码序列,这些非编码序列不成比例地靠近外显子。
人类基因组里约 1% 的长度是外显子。你可以算出:
0.01/0.13 = 0.0769
你可以不太严谨地声称,这显示人类基因组里约 8% 的区域在较大幅度更改时影响生存。
<hr/>这问题下的一些回答对“垃圾 DNA”做出不准确的描述,尤其是“这个名字已经被淘汰”的说法无视了仍在使用这词语的文献。当然,这些论文有不少是在谈论“过去以为是垃圾 DNA 的特定序列原来是有用的”。

回复 支持 反对

使用道具 举报

发表于 2024-12-19 16:13 | 显示全部楼层
上一次提到垃圾DNA还是本科的时候洋洋洒洒写的课程小论文,那时候自私的基因还读到上头,还不会查英文文献,至于非编码区的那些类型和功能,还是无聊的一门课上放在提纲里等着考前突击的考点。在大范围基因测序的时代到来后,传统意义上被称为“垃圾DNA(junk DNA)”的那些序列功能已经在被逐渐确定。或者说,我们对基因组的进一步认识,几乎都是在逐步破译这些未知的密码。比如转座子(Transposable Elements)由于在基因组中大量移动与复制,过去被认为是垃圾DNA的一种,而它们现在已经被证明是改变基因表达的顺式调节因子的一种[1]。再比如表观遗传学中涉及大量的非编码RNA来调节蛋白质在翻译过程中的多样性,这一过程大量而复杂的调控因子也在过去被叫作“垃圾DNA”。可见,我们过去以为的垃圾山,只是我们有眼不识泰山罢鸟。
2012年,DNA 元素百科全书 (ENCODE) 项目公布,发现人类细胞中80.4%基因组元素在至少一种细胞类型中具有例如RNA转录、转录因子结合、染色质结构和组蛋白修饰等的生化活性,也就此宣布垃圾DNA这个概念已经消亡。[2]那么,这可以说明基因组中并没有垃圾DNA吗?C值悖论(随着物种复杂度提高,基因组大小并不总是相应提高)的存在依然需要垃圾DNA这个概念支持;生物体和基因组中也存在着大量的功能冗余,作为进化过程中的痕迹或者环境变化的波动,留下了大量沉默或相似的基因片段;而在我们试图阐释基因的功能时,我们依然会发现很多对进化没有正面作用的中性基因被保留在基因组中[3]。而ENCODE公布的这个80%的结果的数字也有着很多水分[4]。比如,和疾病与某些表型的关联性并不能完全证明某些片段有生物功能。尽管越来越多的神秘DNA功能拨云见日,基因组中的功能冗余依然是一个值得探索的课题。
回到我最爱的植物这里吧~黑麦(Secale cereale)的基因组是小麦族物种中最大的基因组之一,它的单倍体基因组(8.0 Gbp/1C)大于被子植物的平均基因组大小(5.6 Gbp),也明显大于它最近的进化邻居(比如小麦5.8–6.1 Gbp)[5]。实验表明,超过 90% 的黑麦基因组由重复 DNA 组成,这是栽培黑麦在其近亲中基因组优势的直接来源。亚端粒区域中的大异色块(Large heterochromatic blocks)是黑麦区别于大麦和小麦这些近亲的代表性染色体特征。就在上世纪末,人们对这些区域的 DNA 组成进行了分析。发现一些串联组织的家族具有极高的单体拷贝数,这些家族总共占整个黑麦基因组的 8-12%。另外,转座元件(TE)是谷物基因组等大型基因组的主要组成部分。在黑麦基因组中,转座子各个家族的成员的几乎可以相互替代。编码区两端具有长末端重复序列(LTR)的反转录转座子存在一种染色体内异位重组机制,即单独的 LTR 或由 LTR 和内部结构域组成串联阵列,这导致如果 LTR 与任何其他 DNA 序列接壤,则 LTR-LTR 重组将在 LTR 旁边生成这些单体的串联阵列。这大大提高了产生重复片段的可能性。这样的的串联 DNA 重复长阵列结构在基因组中是如何产生的无从得知,而在这数千个复制体聚居地附近,不断运行的重组过程影响着邻近的转座子,形成单独的LTR这类的短序列结构……这样的过程很难说是在参与编码、调节或任何有利于生物生存、繁殖或行为相关的过程。因此,更为合理的解释似乎是——这些染色体区域中的DNA所做的只是确保自身生存,这符合“自私DNA”的标准,也符合核基因组中遗传冗余的概念。自然选择并不像以前看起来那么强大,进化过程中遗传的冗余也一直存在。随着我们对基因组的了解越来越清晰,越来越多的“垃圾DNA”被正名,也有黑麦基因组这样的证据,展示着基因组中搭车客“垃圾DNA”们,也依然存在。
回复 支持 反对

使用道具 举报

发表于 2024-12-19 16:14 | 显示全部楼层
没有完全搞清吧,至今还有很多新鲜的研究在针对所谓的junk DNA(垃圾DNA)的功能。
感觉科学上最大的进步,就是”junk DNA“这个名字已经被淘汰了。
之所以有junk DNA的名字的出现,就是很多年前人们以为基因才是最重要的,染色体上除了编辑基因的DNA都没有用,这才会取个名字叫垃圾DNA。
这些年有太多的研究发现,这些DNA只不过是non-coding,而不是junk。比如说,很多non-coding DNA可以编码有功能的RNA----这些有功能的RNA并不是编码蛋白的mRNA,而是具有特异或非特异的调控作用的小RNA、或者circular RNA等等。
另外,非编码区域也被发现具有很高的转录活性,这些转录活性是因为转录聚合酶复合体在非特异结合在DNA上以后短暂进行转录而产生一些RNA,被称为pervasive transcription(除了在intergenic的区域,在promoter上游也有很多pervasive transcription活性)。这些转录在正常情况下对于维持染色体的稳定性、组蛋白修饰等都有相关作用。
因此,大部分的垃圾DNA都没有几十年前武断定义的那样没有功能。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表