某些DNA序列可以形成规范双螺旋以外的结构。这些被称为非B DNA的替代DNA构象被认为是细胞过程和基因组进化的调节因子,但它们的DNA往往是重复的,直到最近,这使得可靠地读取和组装它们的序列变得困难。
现在,由宾夕法尼亚州立大学生物学家领导的一个研究小组全面预测了类人猿非B DNA结构的位置。研究小组说,这是了解这些结构的功能和进化的第一步,这些结构已知会导致遗传疾病和癌症。
这项工作依赖于人类和其他类人猿的新可用端粒到端粒(T2T)或端到端基因组,这些基因组克服了与重复DNA相关的测序和组装困难,以填补基因组中任何剩余的空白。一篇描述这项研究的论文发表在《核酸研究》杂志上,该论文表明非B DNA在基因组的新测序片段中富集,并暗示了潜在的新功能。
“当人类基因组于2001年首次发表时,它实际上还不完整,”宾夕法尼亚州立大学生物学教授、Verne M.Willaman生命科学主席、研究团队负责人Kateryna Makova说。“大约8%的基因组,主要是重复的DNA,尚未确定,因为现有的技术和计算算法无法重建这些区域。
”2022年和2023年,端粒对端粒联盟的巨大努力填补了人类基因组的这些空白,今年,我们对所有类人猿都做了同样的工作。“
对于大多数已测序的基因组,研究人员使用短读DNA测序技术。这些技术的工作原理是首先将基因组分成数百万个微小片段,这些片段可以测序,然后必须像世界上最复杂的拼图游戏一样精心重新组装。
”宾夕法尼亚州立大学生物学博士后研究员、该论文的第一作者Linnéa Smeds说:“大部分基因组由重复的DNA组成,它们可能以数百甚至数千个相同短序列的形式沿着染色体背靠背排列。”许多看起来一样的拼图。T2T基因组使用新的长读测序技术克服了这一点,使我们能够在更少的较长片段中对基因组进行测序。通过这种方式,我们可以首次探索这些区域中有趣的功能元件,如非B DNA。“
非-B DNA可以采取多种形式,包括弯曲的DNA、发夹、G-四链体(G4s)和基于某些序列基序的Z-DNA,这些基序往往是重复的。这些结构最近与几个细胞过程有关,例如细胞分裂过程中的DNA复制启动、基因表达调控以及端粒(染色体末端的帽)和着丝粒的功能,着丝粒是细胞分裂中起关键作用的染色体结构。
与超过100000名依赖Phys.org获取日常见解的订阅者一起探索科学、技术和太空的最新进展。注册我们的免费通讯,每天或每周获取重要突破、创新和研究的最新消息。
研究小组在T2T基因组中搜索这些序列基序,以确定人类、黑猩猩、倭黑猩猩、大猩猩、两种猩猩物种和用作外群的较小类人猿siamang基因组中所有潜在的非B形成区域。
“我们现在对这些基因组中容易形成非B DNA的基序有了一个完整的了解,“Smeds说。
研究小组发现,基因组中新破译的序列富含非B基序,非B DNA分布模式在猿类物种中基本相似。已知大猩猩基因组具有更高比例的重复DNA,也含有更多潜在的非B DNA基序。
非B DNA也往往具有更高的突变率,并且可能不稳定,这可能导致DNA断裂并允许染色体重排,研究人员认为这可能对基因组进化和某些遗传疾病很重要。
”最近,一种被称为卫星DNA的重复DNA被证明可以Smeds说:“这是与一种唐氏综合征相关的21号染色体易位的断点。我们发现Z-DNA(一种非B DNA)的基序在该区域的频率是基因组其他部分的97倍,这可能表明非B DNA在这些类型的染色体重排中的作用,但需要进一步的研究来验证这种关系。“目前只分析了少量的基序,研究人员通过实验证实了非B DNA结构确实会形成,但强调绝大多数需要进一步确认。
”Makova说:“在给定的基序上形成非B DNA的结构几乎肯定会依赖于上下文。这可能取决于细胞类型、发育阶段和基因组上下文,包括甲基化等DNA修饰。最近,我们对基因组功能的看法发生了转变,超越了序列,包括了结构。
“我们希望我们的研究能够成为进一步研究这些新结构特征在基因组中的功能的跳板。”
Journal information: Nucleic Acids Research
Provided by Pennsylvania State University
2025-05-10
2025-05-10
2025-05-10
2025-05-10
2025-05-10