超级计算机绘制修复受损DNA的分子蓝图

Sunburns and aging skin are obvious effects of exposure to harmful UV rays, tobacco smoke and other carcinogens. But the effects aren't just skin deep. Inside the body, DNA is literally being torn apart.

晒伤和皮肤老化是暴露于有害紫外线、烟草烟雾和其他致癌物质的明显影响。但这些影响不仅仅是肤浅的。在身体内部,DNA正在被撕裂

了解身体如何愈合和保护自己免受DNA损伤对于治疗遗传疾病和癌症等危及生命的疾病至关重要。但是,尽管有许多研究和医学进步,但DNA修复的分子机制仍然是一个谜

在过去的几年里,佐治亚州立大学的研究人员利用能源部橡树岭国家实验室的Summit超级计算机研究了一种名为核苷酸切除修复(NER)的复杂分子途径。NER依靠一系列高度动态的蛋白质复合物以手术精度切割(切除)受损的DNA

在发表在《自然通讯》上的最新研究中,该团队建立了一个名为预切口复合体(PInC)的关键NER组件的计算机模型。PInC在NER通路后期调节DNA修复过程中起着关键作用。解码NER复杂的事件序列和PInC在该途径中的作用,可以为开发新的治疗方法和预防导致早衰和某些类型癌症的疾病提供关键见解

佐治亚州立大学化学教授、首席研究员Ivaylo Ivanov说:“我们对细胞修复其遗传物质的方式感兴趣。”。“NER是一种多功能的途径,它通过一个依赖于微妙平衡的分子机制的三阶段过程来修复各种不同的DNA损伤。不幸的是,有害突变可能会干扰这种机制并导致严重的人类疾病。”

“然而,基因突变的影响可能会因其在修复复合体中的位置而显著不同。在某些情况下,突变会导致患者对紫外线敏感,并具有极端的癌症易感性。在其他情况下,它们会导致异常发育和过早衰老,”他说。“为什么会发生这种情况在分子水平上还不完全清楚。这就是我们的计算机建模工作旨在解开的谜团。”

PInC组装的结构组织。PInC组件由子单元着色。XPG、XPF/ERCC1和DNA以卡通表示。TFIIH、XPA和RPA以曲面表示方式显示。含有DNA链的病变以青色显示;未损坏的线束以蓝色显示。来源:自然通讯(2024)。DOI:10.1038/41467-024-52860-y NER的三个修复行为分为三个不同的阶段:识别、验证和修复。每个阶段都需要不同的蛋白质组来执行特定的功能,就像创伤团队在急诊室需要不同的专家来治疗受伤的患者一样。这样,NER机器可以根据手头的任务进行调整和改变形状

在第一阶段,NER蛋白XPC(着色性干皮病C组)的作用类似于第一反应者,它定位受损DNA或病变的部位,然后扭曲DNA螺旋使损伤可及。XPC然后调用其他修复蛋白来帮助启动第二阶段,称为损伤验证或损伤扫描

在这里,NER蛋白机制转变为下一个形状。当XPC后退时,称为转录因子IIH或TFIIH(发音为T-F-2-H)的蛋白质复合物移动到位。TFIIH进一步解开DNA片段,并扫描新暴露的DNA链是否有损伤

之后,在修复的第三个也是最后一个阶段,它掌握在外科医生手中——PInC

随着“患者”的稳定和手术准备,可以开始去除受损DNA链的手术。XPF和XPG(着色性干皮病F组和G组)这两种酶精确地定位在病变的两侧,并充当分子剪刀来剪切受损的DNA片段

一旦病变被移除,新的DNA就会被合成以填补留下的空白。最后,DNA骨架被密封,受损的DNA恢复健康

将XP和XP/CS疾病突变映射到PInC群落结构上。网络分析中的动态社区如图6所示。人类疾病突变表现为球体,并按表型着色。来源:自然通讯(2024)。DOI:10.1038/41467-024-52860-y

伊万诺夫说:“我们想知道的是PInC在病变扫描阶段后是如何形成的。”。“它是如何控制执行受损DNA链双重切割的两个酶亚基的定位的?重要的是,这两种酶之间是否存在串扰?它们是否相互感应?”

与超过100000名依赖Phys.org获取日常见解的订阅者一起探索科学、技术和太空的最新进展。注册我们的免费时事通讯,每天或每周获取重要突破、创新和研究的最新进展

他补充道:“这很重要,因为一旦受损的DNA链被切割,通过填补这一空白来完成修复过程至关重要。”。“否则,它将导致细胞死亡或引入双链断裂,这对细胞极其有害。”

要回答这些问题,研究人员需要解决PInC的结构。在生物学中,理解蛋白质结构对于理解蛋白质组装的行为或功能至关重要。蛋白质的形状、大小和相互作用决定了它们如何结合在一起形成大型生物分子组件

伊万诺夫说:“我们使用各种生物物理技术,特别是冷冻电子显微镜的数据整合了PInC的结构模型。”。“但最终,计算是把一切放在一起的。”

就像拼图游戏的碎片一样,PInC模型必须由已知的组成蛋白质的结构组装而成,所有的单个碎片都必须以3D的形式放在一起。然而,许多PInC组件没有已知的实验结构

为了克服这一挑战,研究人员使用了一种名为AlphaFold2的神经网络模型来预测未知的结构以及将PInC结合在一起的蛋白质之间的界面

将XP和XP/CS疾病突变映射到PInC群落结构上。网络分析中的动态社区如图6所示。人类疾病突变被表示为球体,并由Rosetta ddG评分着色,该评分是蛋白质稳定性的代表。来源:自然通讯(2024)。DOI:10.1038/41467-024-52860-y Summit的最终模拟

伊万诺夫说:“从计算上讲,一旦你组装了PInC,对复杂结构的分子动力学模拟就变得相对简单,尤其是在Summit这样的大型超级计算机上。”

纳米分子动力学(NAMD)是一种专门为超级计算机设计的分子动力学代码,用于模拟包含数百万个原子的大型生物分子系统的运动和相互作用。研究小组使用NAMD进行了广泛的模拟。200 petaflop Summit超级计算机的数字处理能力——每秒能够执行200000万亿次计算——对于在微秒的时间尺度上揭示PInC复合体的功能动态至关重要

伊万诺夫说:“模拟向我们展示了PInC机器的复杂性。它向我们展示的是这些不同的组件如何作为模块一起移动,以及如何将这个复杂的组件细分为动态的社区,这些社区构成了这台机器的运动部件。”

这些发现具有重要意义,因为XPF和XPG的突变会导致严重的人类遗传性疾病。其中包括着色性干皮病,这是一种使人们更容易患皮肤癌症的疾病,以及可影响人类生长发育、导致听力和视力受损并加速衰老过程的Cockayne综合征

伊万诺夫说:“模拟使我们能够专注于这些重要区域,因为干扰NER复合物功能的突变通常发生在群落界面,这是机器最动态的区域。”。“现在我们对这些疾病如何以及从何处表现有了更好的了解。”

大多数分子动力学模拟都是在Summit上进行的。然而,经过6年的生产,Summit于2024年底退役。

展望未来,Ivanov和他的团队计划使用Summit的继任者Frontier,这是2022年上线时作为世界上最强大的超级计算机首次亮相的EB级超级计算机。

他们在Frontier上的工作将涉及研究转录偶联NER,这是一种DNA修复过程,可以修复主动转录基因的损伤,以确保基本蛋白质可以继续制造

除伊万诺夫外,研究团队还包括佐治亚州立大学的余、严春丽、保罗和布鲁尔;劳伦斯伯克利国家实验室的Susan E.Tsutakawa和John A.Tainer;Chi-Lin Tsai在得克萨斯大学MD安德森癌症中心;阿卜杜拉国王科技大学的Samir M.Hamdan