广东省农科院研究人员携手千年基因,揭示水稻品种RGD-7S和Taifeng B的杂交后代F1在种植早、晚期先后出现杂交劣势和杂交优势的遗传基础。 研究背景 两个籼稻品种RGD-7S和Taifeng B的F1杂交后代在种植季的早期和晚期会分别表现出杂交劣势和杂交优势。为解释这一现象,研究人员对RGD-7S和Taifeng B进行了个体基因组重测序,通过分析这两个基因组之间的变异,发现了杂交劣势、杂交优势出现的基因基础。 材料与方法 材料:RGD-7S和Taifeng B的基因组DNA; 测序平台: Illumina HiSeq 2000 100 bp PE 结果与分析 测序结果: RGD-7S和TaifengB的重测序数据量分别为14,973,227,780 bp 和15,457,502,782 bp,测序深度达到27.83X和28.72X,测序质量(Q30)分别为91.61%和89.92%。将测序数据比对至参考基因组粳稻Nipponbare,其覆盖度分别达到了85.5% 和86.69%,这表明两个籼稻品种与粳稻Nipponbare之间存在着巨大的遗传差异,也反映出籼稻、粳稻亚种间经过遗传分化积累下的内在差异。 表1.两个籼稻品种HiSeq2000重测序数据及相对于粳稻覆盖度
SNPs和InDels: 通过与粳稻参考基因组比较,共得到了2,758,740个多态性位点,包括2,408,845个SNPs和349,895个InDels。其中RGD-7S共有 2,082,219 个多态性位点(1,744,556 SNPs,337,663 InDels) ,TaifengB共有2 ,156,997 (1,821,644 SNPs,335,353 InDels)。在两个籼稻品种间发现了961,791个SNPs 和 46,640个InDels,其中10号染色体上的SNPs和InDels具有最高的变异频率,并且这些多态性位点多分布于基因间、上游、下游和内含子中,主要是由于这些区域在进化中选择压力较小,并且这些位点仅影响基因的表达,并不会影响基因的功能。 RGD-7S和Taifeng B之间的DNA多态性密度是每100 kb有256.8个SNPs和12.5个InDels,这一发现为发展分子标记及克隆杂交弱势基因提供了便利。 表2.品种RGD-7S和Taifeng B相对于粳稻基因组的SNPs及InDels的分布 表3.RGD-7S和Taifeng B之间DNA多态性的分布与频率 分析了SNPs在不同基因区域的的分布。发现其主要分布在基因的上游,下游、基因间,内含子,外显子等区域,比率分别达到了30%, 32%, 23%, 7% 和5%。 表4.不同区域变异的数量及比率 大效应SNPs可能会影响基因组的功能,以前的报道是在水稻中有2.7%的基因存在大效应SNPs。作者在分析了大效应SNPs及其分布后发现,两个品种有20%的基因存在达效应SNPs。 表5.大效应SNPs基因区域分布 在RGD-7S和Taifeng B中检测到了大量的InDels,可以作为分子标记来定位杂交劣势基因。GD-7S有 349,895个 (177,194个缺失,172,701个插入),Taifeng B有352,336个 (174388个缺失,177948个插入) 。91%的插入和缺失集中在1-9个碱基(如2)。为了验证InDels作为分子标记的可靠性,作者设计了标记行了验证,大约71%的InDels经过了确认。 图1. RGD-7S和Taifeng B不同InDels大小分布
图2. RGD-7S和Taifeng B不同基因区域DNA变异比率 GO 分析 Taifeng B和RGD-7S基因的不同主要分布在细胞组分(9208 and 9236),催化活性(6319 and 6341),结合活性(6637 and 6658),细胞过程(7976 and 7982)和代谢过程(8682 and8675)(图 3)。丰度显著性分析表明TaifengB and RGD-7S间不同的基因主要分布在相同的组内,如酶活性,糖结合,细胞蛋白修饰,核苷酸结合,信号转导,水解酶活性和应激反应。 图3. RGD-7S 和Taifeng B包含DNA变异基因的GO条目分布 图4. RGD-7S and Taifeng B不同基因丰度分布 拷贝数变异CNVs 拷贝数变异可以产生新的基因,改变基因量和改变基因结构被认为是基因组变异的主要来源,并且可能会影响表型遗传,基因表达与适应性。因此作者分析了RGD-7S和Taifeng B的CNVs,分别得到2727个与2010个 CNVs。RGD-7S在第9号染色体上CNVs最多,共819个。两个品种11号染色体上最少,RGD-7S和Taifeng B分别为49个和29个。 表6. RGD-7S和Taifeng B CNVs分布 结论 共得到了2,758,740 个多态性位点,包括 2,408,845个SNPs和349,895个InDels,DNA多态性密度是每100 kb有256.8个SNPs和12.5个InDels。 分别得到2727个与2010个 CNVs,在RGD-7S中,2,727个 CNVs中有1,989个重叠在218个基因中,在Taifeng B中2,010 CNVs中1,231个重叠在175个基因中。 验证了杂交弱势基因Hw3和Hw4中的InDel分子标记。 以上结果为解析杂交劣势和杂交优势基因奠定了基础。
|