组计划 图1 “中国人群泛基因组联盟”(CPC)一期36个族群画像集 中国人群泛基因组图谱已公开在线发布:https://pog.fudan.edu.cn/cpc/#/;https://github.com/Shuhua-Group/Chinese-Pangenome-Consortium-Phase-I; 该项研究所涉及的样本信息和数据的公开发表已获得国家人类遗传资源管理部门批准。该项研究得到了国家自然科学基金重点项目、基础科学中心、国家重点研发计划等项目的资助。 论文链接:https://www.nature.com/articles/s41586-023-06173-7 赵国屏(中国科学院院士) 由复旦大学、西安交大、中国医学科学院等研究单位的一批中青年学者组织的“中国人泛基因组联盟”,汇聚我国各方面多年努力积累的数据,构建出高质量的中国人群泛基因组图谱,在国际顶级科学期刊Nature正式发表,是一件值得庆贺和重视的大事。 与曼哈顿原子弹计划、阿波罗登月计划并称为人类科学史上三大科学工程的人类基因组计划(HGP),最主要的成果就是构建了一个沿用至今并在不断完善中的人类参考基因组(reference genome)。人类参考基因组之所以重要和有用,因为人类虽然是一个物种,其基因组大致相似(如果不考虑结构变异,在组成人类基因组的30亿个碱基对中,大约99.9%是一致的),然而,人类个体的基因组又是各不相同的;而正是这0.1%左右(大约三百万碱基对)的不同,造成了人类各族群、个体间表型不同(从长相的不同到健康状况的差异)的遗传基础。所以,要能够正确使用人类基因组序列,帮助我们认识人类自身特别是与我们健康密切相关的基因组信息,以获得有价值的知识,必须有一张能够指导待研究对象的基因排序和组合的导航图,这就是人类参考基因组。 这张被广泛应用于人类遗传学和医学研究的遗传密码“导航图”,是解析人类起源与演化、解析人类表型和疾病的遗传基础的根基。20年前人类基因组计划完成之初,用于国际基因组计划(HGP)的大部分DNA来自于住在纽约州布法罗的一名白人男性捐献者(编号为RP11)。同时公布的来自Craig Venter领导的塞雷拉基因組计划的DNA样品来源于五名捐献者,其中虽然有亚裔和非洲裔人,依然是高加索人为主。因此,通用的人类参考基因组代表的是以白人为主的基因组序列。此后,经过人类单碱基差异的单倍型作图(HAP),单碱基差异的全基因组相关分析(GWAS)以及对大量自然人群的全基因组测序(WGS),这个以高加索人为主的尚“不完整”的参考基因组,在过去20年里,推动了整个人类生命科学和医学研究的长足进展! 国际人类基因组计划虽然是欧美主导的大型国际合作计划,但是,我国科学家在这个生命科学发展历程的关键节点上,不忘为中国人民健康事业服务的“初心”,牢记面向国际基因组研究科学前沿,面向我国生物医药发展重大需求的“使命”,乘“改革开放”带来的“科学春天”的东风,以“只争朝夕”的精神,抓住机遇,成为参与这一重大国际合作计划的唯一发展中国家,为人类基因组测序和基因识别作出了“两个百分之一”的贡献;同时,展开有我国特色的医学基因组学和以人类健康为宗旨的功能基因组学研究;使我国生物医学研究在世纪之交,基本摆脱以往的落后状态,赶上了新时代的快车道。 但是,我们应该清醒地认识道,我国的人类基因组学研究与西方尤其是欧美相比,还存在不小的差距,东西方发展至今依然极度不平衡,我们依然需要积极参与包括人类基因组研究在内的生物医学大科学研究的国际竞争与合作。但是,我注意到上个月发表的国际人类泛基因组联盟的成果,其中没有一家中国的研究单位,这说明过去好不容易建立起来的国际合作的氛围与精神,近年来出现了迟滞的态势;虽然个中原因复杂,但值得认真反思总结。 无论如何,人类是一个物种,在人类这个物种中,亚裔和华裔人群是一个重要的组成部分;人类社会是不可分割的命运共同体,在人类社会发展中,中国和东亚、东南亚地区和国家占据不可忽略的重要性。西方发达国家,尽管有大量的亚裔和华裔人群,尤其是在美国,如今华裔美国人口的数量已经达到了500多万,但是其基于基因组的生物医学研究投资重心依然是聚焦于白人,其次是黑人,亚裔或华裔族群大多数情况下都很难排到优先级考虑。因此,在如今的基因组研究态势中,依然不可忽视我国丰富的人类遗传资源(特别是由多民族组成的占世界人口总数20%以上的中华民族群体)是研究人类基因组多样性、人类进化和人类疾病相关基因的宝贵材料;同样,发展中国的医疗事业和生物医药产业必需要拥有中国自己的完整的基因组信息,包括我国专属参考基因组和泛基因组资源和分析体系,形成我国自主可控的人类基因组资源与核心技术。忽视这一点,不论在学术上还是在医学应用上考虑,都是严重阻碍我国科学发展和医学进步的。 今年正值国际人类基因组计划(HGP)完成20周年,也成为人类参考基因组从“线性一维序列”过渡到“泛基因组多维图谱”的转折年。值此历史发展重要转折点,复旦大学、西安交大、中国医学科学院等研究单位的一批中青年学者,能团结国内的力量,组织中国人自己的基因组联盟,并且独立自主地构建出高质量的中国人群泛基因组图谱,最终得到国际顶级期刊的认可和发表,这是值得肯定的,也是需要鼓励和支持的。这一成果表明我国科学家在人类基因组学领域的研究水平得到了显著提升。我相信这项工作对我国的人类基因组学和医学中的复杂疾病遗传基础研究等领域会起到重要的推动作用! 张亚平(中国科学院院士) 基因组是生命演化的遗传信息载体,也是研究人类起源和复杂疾病的数据信息根源。不论是动植物,还是人类,复杂性状的遗传学研究都遇到了一个瓶颈——“missing heritability”(丢失的遗传率)问题,即目前的研究未能鉴别出能充分解释表型预期遗传贡献的基因变异。这部分与参考基因组的不完整性和多样性覆盖度不充分有关。虽然国际上也发起了以欧美发达国家主导的重构人类参考基因组的计划,然而,是否有必要建立中国人群的参考基因组是应该认真对待的问题。徐书华团队在前期研究中从变异判读、进化研究、医学应用三个方面分析和评估了建立高质量族群特异性参考基因组的必要性。此次复旦大学、西安交大、中国医学科学院等多家单位联合发布的中国人泛基因组研究成果,再次表明了建立我国人群泛基因组图谱的必要性以及该图谱在重构人类演化历程和挽回复杂疾病研究中“丢失的遗传率”等研究和应用中的潜在价值。这是一个很好的开端!希望我国学者再接再厉,不断完善我国人群参考基因组和泛基因组资源和分析体系,形成我国完善的人类基因组资源与核心技术,提升我国在人类基因组学领域的自主地位,支撑“健康中国”、“精准医学”等国家战略。 金力(中国科学院院士) 今年,正值“国际人类基因组计划”(HGP)完成20周年,我很欣慰地看到这项由我国学者主导的人类泛基因组研究得以在Nature发表。 人类基因组研究是基因组学中起步最早的方向,在数据资源、技术方法和研究成果等方面都曾领先于其他物种的研究。但是,这种“先发优势”也使得人类基因组研究越来越难以取得新的突破性成果。近年来,动物、植物、非人灵长类、反刍动物等领域的基因组学研究进展很快,取得了令人瞩目的成绩。相比之下,人类基因组研究显得有所“滞后”。而此次发表的成果,打破了人类基因组学研究的这种“停滞”,也是我国科学家在人类基因组研究领域取得的又一重大进展。 很有意思的是,这项研究发现通用参考基因组上缺失的参考序列富集了适应性演化和起源于远古人类的遗传变异,并且与角质化、紫外线辐射应激、DNA 修复、免疫反应以及寿命等表型或功能相关。这反映了我们的基因组中可能仍有大片有价值的矿藏尚未得到充分开采。 值得注意的是,这项研究除了在通用参考基因组之外发现约590万个单核苷酸多态性变异和插入/缺失变异之外,还鉴别出约3.4万个结构变异(Structural variation, SV),并且涉及至少1367个蛋白编码基因。我想强调的是,基因组结构变异大概是生物进化中从微观到宏观演变的关键遗传基础,也是最有可能连接渐变到跃变这个“鸿沟”的进化密码。我相信,通过对基因组结构变异的高精度解析,不但能大幅提升“基因型-表型”关联分析的功效,而且有可能最终帮助我们理解生命演化中重要性状和功能产生的遗传基础和分子机制。 中国人泛基因组联盟(1期)成员
|