Newly generated, complete "end-to-end" reference genomes for the sex chromosomes of five great ape species and one lesser ape species—produced by an international collaborative team led by researchers at Penn State, the National Human Genome Res
由宾夕法尼亚州立大学、国家人类基因组研究所和华盛顿大学的研究人员领导的一个国际合作团队为五种类人猿和一种较小类人猿的性染色体新生成的完整的“端到端”参考基因组,突显了类人猿物种中雄性特异性Y染色体的快速变化
这些发现揭示了性染色体的进化,并为猿类和人类了解与这些染色体上的基因相关的疾病提供了信息。这项新研究发表在《自然》杂志上
“Y染色体对人类生育能力很重要,X染色体含有对生殖、认知和免疫至关重要的基因,”Verne M.Willaman生命科学主席、宾夕法尼亚州立大学生物学教授兼研究团队负责人Kateryna Makova说
“我们的研究为未来对性染色体、它们是如何进化的以及与之相关的疾病的许多研究打开了大门。我们研究的现存非人类类人猿都处于濒危状态。它们完整的性染色体序列的可用性将有助于研究它们在野外的性别特异性传播以及它们对繁殖和生育至关重要的基因。”
这些参考基因组是一个有代表性的例子,对未来对这些物种的研究很有用。研究小组发现,与X染色体相比,Y染色体在猿类物种中差异很大,并包含许多物种特异性序列。然而,它仍然受制于纯粹的自然选择—通过去除有害突变来保护其遗传信息的进化力量
Makova说:“研究人员在2001年对人类基因组进行了测序,但实际上并不完整。”。“当时可用的技术意味着,直到2022-23年由Telomere to Telomere(T2T)联合会领导的新一轮努力,某些缺口才得以填补。我们利用人类T2T联盟开发的实验和计算方法来确定我们在世的近亲性染色体的完整序列—类人猿。“
该团队为五种类人猿(黑猩猩、倭黑猩猩、大猩猩、婆罗洲猩猩和苏门答腊猩猩)生成了完整的性染色体序列,这五种类猿包括当今生活的大多数类人猿以及较小的类人猿西亚芒。他们为每个物种的一个个体生成了序列。
由此产生的参考基因组充当了基因和其他染色体区域的图谱,可以帮助研究人员对该物种的其他个体的基因组进行测序和组装。这些物种以前的性染色体序列不完整,或者婆罗洲红猩猩和西亚芒不存在。”宾夕法尼亚州立大学博士后研究员、该研究的第一作者之一Karol pá;l说:“Y染色体的测序一直很有挑战性,因为它包含许多重复区域,而且由于传统的短读测序技术在短时间内解码序列,很难将产生的片段按正确的顺序排列。”T2T方法使用长读测序技术来克服这一挑战。结合计算分析的进步,我们与NHGRI的Adam Phillippy团队合作,这使我们能够完全解决以前难以测序和组装的重复区域
“通过将X和Y染色体相互比较,以及在物种之间进行比较,包括与之前生成的人类T2T序列的X和Y进行比较,我们了解了许多关于它们进化的新事物。”
Y染色体的高度变异性因此,在六种猿类中,研究小组发现,在包括大小在内的各种特征上,Y染色体的变异性远大于X染色体。在所研究的猿类中,X染色体的大小从ACTG字母表的1.54亿个字母不等;代表组成DNA的核苷酸—黑猩猩和人类中的1.78亿个字母在大猩猩中。相比之下,Y染色体的范围从暹罗猩猩的3000万个DNA字母到苏门答腊猩猩的6800万个字母
物种之间共享的DNA序列量在Y染色体上也更具可变性。例如,人类和黑猩猩之间约98%的X染色体排列,但它们之间只有约三分之一的Y染色体排列。研究人员发现,这在一定程度上是因为Y染色体更有可能被重排或部分遗传物质被复制
此外,重复序列占据染色体的百分比在Y上是高度可变的。然而,根据物种的不同,62%至66%的X染色体被重复元素占据,71%至85%的Y染色体被重复元件占据。这些百分比在X和Y染色体上都高于人类基因组中其他染色体
“我们发现类人猿Y正在缩小,积累了许多突变和重复,并失去了基因,”Makova说“那么,为什么Y染色体没有像之前的一些假设所暗示的那样消失呢?我们与天普大学的Sergei Kosakovsky Pond和其他人合作,发现Y染色体上仍有许多基因在纯化选择下进化,这是一种保持基因序列完整的自然选择。其中许多基因对精子发生很重要。这意味着Y染色体不太可能很快消失。”
研究人员发现,Y染色体上的许多基因似乎使用两种策略来生存。第一种利用了基因冗余;染色体上存在同一基因的多个拷贝—使得基因的完整拷贝可以补偿可能获得突变的拷贝。该团队通过首次完成猿性染色体上多拷贝基因家族的景观,量化了这种遗传冗余
第二种生存策略利用回文,其中DNA字母表中的字母序列后面跟着相同但相反的序列,例如ACTG-GTCA。当位于回文组中时,基因受益于回文组纠正突变的能力
“我们发现Y染色体可以在两个回文臂的重复序列之间与自身交换遗传信息,这两个回文臂折叠,使倒置的序列对齐,”pá;我说
“当同一基因的两个拷贝位于回文中,其中一个拷贝被突变击中时,可以通过与另一个拷贝的基因交换来挽救突变。这可以弥补Y与其他染色体缺乏遗传信息交换的缺陷。”
研究团队也首次获得了猿性染色体上回文的完整序列,因为它们以前很难测序和研究。他们发现,回文在猿的Y染色体上特别丰富和长,但它们通常只在亲缘关系密切的物种中共享
与约翰·霍普金斯大学的Michael Schatz及其团队合作,研究人员还研究了129只大猩猩和黑猩猩的性染色体,以更好地了解每个物种的遗传变异,并寻找自然选择和其他进化力量作用于它们的证据
宾夕法尼亚州立大学生物学助理教授、论文作者Zachary Szpiech说:“我们通过将之前研究的大猩猩和黑猩猩的性染色体测序读数与我们的新参考序列进行比对,从它们身上获得了大量新信息。”
“虽然未来增加样本量将非常有助于提高我们检测不同进化力量特征的能力,但在处理濒危物种时,这在伦理和逻辑上都具有挑战性,因此我们必须充分利用现有数据。”
宾夕法尼亚州立大学生物学助理教授、论文作者克里斯蒂安·胡贝尔说:“我们使用的生物信息学技术和进化分析的强大结合,使我们能够更好地解释作用在我们在世的近亲类人猿性染色体上的进化过程。”。“此外,我们制作的参考基因组将有助于未来灵长类进化和人类疾病的研究。”