拉霍亚免疫学研究所(LJI)的科学家开发了一种新的计算方法,将我们DNA上的分子标记与基因活性联系起来。他们的工作可能有助于研究人员将基因与开启或关闭基因的分子“开关”连接起来。
这项发表在《基因组生物学》上的研究是利用机器学习方法更好地理解基因表达与疾病发展之间联系的重要一步
LJI副教授Ferhat Ay博士与LJI教授Anjana Rao博士共同领导了这项研究在这项新研究中,LJI的研究人员使用了称为线性和图神经网络的机器学习工具来处理基因组数据并建立这些联系。神经网络是以大脑中的神经元如何处理信息和识别模式为模型的计算工具。图形神经网络能够整合3D信息,例如细胞内的DNA物理相互作用
Edahí;Gonzá;lez Avalos博士作为加州大学圣地亚哥分校的研究生,在LJI的Rao和Ay的联合指导下,率先开发了这种图神经网络。Gonzá说:“我们可以利用这一点来优先考虑基因组内的DNA相互作用。”;lez Avalos,他现在在Guardant Health工作
神经网络开始工作研究人员训练了新的神经网络,学习一种名为5hmC的重要DNA修饰的存在,无论是在基因附近还是远离基因,如何与基因表达活性相关。羟甲基与胞嘧啶的这种连接与增强子活性有关
事实上,5hmC似乎对基因表达有着如此重要的影响,以至于科学家们将5hmC与A、T、C、G一起称为DNA字母表的“第六个字母”,以及一种称为5mC(第五个碱基)的中间甲基化形式。胞嘧啶将5mC转化为5hmC与增强子活性有关;5hmC越多,增强子活性水平就越高
在之前的研究中,Rao实验室的研究人员发现,5hmC在基因组中的位置会根据他们观察的细胞类型而变化—以及这些细胞类型表达了什么基因。实际的DNA编码是相同的,但在肝细胞与肺细胞或脑细胞的不同位置,5hmC会附着在基因组上
这种5hmC分布控制了这些不同类型细胞中不同基因集的表达。研究人员发现,5hmC附着在基因组中起增强子作用的区域上;有助于开启和关闭基因表达的相同区域—以及基因本身。这些活性基因和增强子的差异是肝细胞与肺细胞或大脑神经元的区别
Rao说:“5hmC的分布因细胞类型而异。”。“如果你能知道5hmC在哪里,你就能推断出你正在研究的DNA是哪种细胞类型。”例如,如果一个细胞是癌症细胞,你就可以推断出它是哪种类型的癌症,即使它已经转移(远离)了它在体内的原始位置与早期方法相比,新的研究方法可以在基因和增强子之间建立更简单的联系
Gonzá说:“这篇论文证明了我们可以使用这些图神经网络来预测基因和增强子之间的相互作用。”;lez Avalos Ay说,他很高兴看到神经网络如何揭示基因和基因组遥远区域5hmC之间的联系。这些跨基因组的长距离连接有助于优先考虑具有增强基因表达能力的区域 Ay说:“令人兴奋的是,这些遥远的增强子中的一些是以前从未发现的新的调节元件。”展望未来,研究人员希望更深入地研究5hmC的分布,以更好地了解人类细胞中的增强子和基因相互作用。Ay说:“这项研究是用小鼠细胞的数据进行的。”。“接下来,我们想研究患者的免疫细胞和癌症细胞中的5hmC及其相互作用。”
希望更好地诊断癌症就像在正常细胞中一样,不同的癌症细胞类型中5hmC的分布不同。这意味着新的LJI方法可能对理解驱动癌症发展的遗传机制有价值
Rao表示,新方法也可能为更快、更准确的癌症诊断打开大门目前,科学家很难分析血液样本中是否有实体瘤的迹象。Rao说:“血液中通常没有实体瘤细胞。可用的是DNA,通常是DNA被部分降解。”
正如Rao所解释的,医生可以帮助更多的患者—并有可能更早地发现癌症—如果他们能超越DNA本身,转而分析5hmC的分布
在科学家拥有这种癌症检测工具之前,还需要做更多的工作,但Ay表示,新的工作显示了将实验数据与新的计算方法相结合的力量。Ay说:“这表明,通过应用我们的新方法,我们可以识别出新的和未标记的远距离增强子。”
Journal information: Genome Biology
Provided by La Jolla Institute for Immunology
2024-09-15
2024-09-15
2024-09-15
2024-09-15
2024-09-15