来自东芬兰大学、阿尔托大学和奥卢大学的研究人员开发了一种新的计算方法来探索DNA序列模式。这种称为KMAP的方法能够直观地可视化短DNA序列,并有助于揭示调控元件在不同生物环境中的行为。这项研究最近发表在《基因组研究》上。
KMAP将DNA序列(称为k-mers)投影到二维空间中,使识别和解释具有生物学意义的DNA序列模式(也称为DNA基序)变得更加容易(图1)。在对尤文氏肉瘤数据的重新分析中,研究人员使用KMAP分析了参与基因调控的基因组区域。
他们发现转录因子BACH1、OTX2和KCNH2/ERG1被癌基因ETV6抑制,一旦ETV6降解,它们在启动子和增强子区域变得活跃(图2)。值得注意的是,该研究还发现了一种未被表征的DNA基序CCCAGGCTGGAGTGC,它经常在增强子区域的短窗口内与BACH1和OTX2共定位。这种空间聚类表明了一种潜在的与癌症生物学相关的新调节元件。
KMAP还用于分析基因组编辑实验的结果,在该实验中,广泛使用的CRISPR-Cas9技术被应用于人类基因组中称为AAVS1基因座的特定位置。编辑后,细胞会以不同的方式自然修复断裂的DNA。
通过可视化这一过程中的数千个DNA序列,KMAP揭示了DNA修复的四种常见模式——每种模式都与细胞使用的不同修复途径有关。了解这些模式可以帮助研究人员设计更精确的基因编辑策略,并预测最有可能发生的编辑类型。
“KMAP提供了一种更直观的方法来研究DNA序列数据中的基序,”该研究的主要作者、东芬兰大学的Lu Cheng博士说。“通过可视化短DNA序列的分布,我们可以更好地解释调控模式,并了解它们在不同生物条件下的变化。”奥卢大学的魏功红教授说:“KMAP是一种多功能工具,可以应用于多种类型的测序数据。”。“在癌症研究中,它可以帮助从ChIP-seq数据中识别调节元件,也有望研究RNA结合蛋白及其结合偏好。它在复杂序列数据中揭示结构的能力使其在分子生物学中广泛有用。”
这项合作工作展示了计算生物学如何揭示基因调节的隐藏层,并支持癌症和基因组工程的未来研究
Journal information: Genome Research
Provided by University of Eastern Finland
2025-05-13
2025-05-13
2025-05-13
2025-05-13
2025-05-13