通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 信息科技

生物信息学:研究人员开发了一种新的机器学习方法

本站发布时间:2024-01-20 16:17:49

为了对抗病毒、细菌和其他病原体,合成生物学提供了新的技术方法,其性能正在实验中得到验证。维尔茨堡亥姆霍兹RNA感染研究所和亥姆霍兹人工智能合作社的研究人员应用数据集成和人工智能(AI)开发了一种机器学习方法,可以比以前更准确地预测CRISPR技术的疗效。这些发现发表在今天的杂志上基因组生物学.

生物体的基因组或DNA整合了蛋白质的蓝图,并协调新细胞的产生。为了对抗病原体、治愈遗传疾病或实现其他积极效果,分子生物学CRISPR技术正被用于特异性改变或沉默基因并抑制蛋白质产生。

这些分子生物学工具之一是CRISPRi(来自“CRISPR干扰”)。CRISPRi在不改变DNA序列的情况下阻断基因和基因表达。与CRISPR-Cas系统(也称为“基因剪刀”)一样,该工具涉及一种核糖核酸(RNA),它可以作为指导RNA来指导核酸酶(Cas)。然而,与基因剪刀不同的是,CRISPRi核酸酶只与DNA结合而不切割DNA。这种结合导致相应的基因不被转录,从而保持沉默。

到目前为止,预测这种方法对特定基因的性能一直具有挑战性。维尔茨堡亥姆霍兹RNA感染研究所(HIRI)的研究人员与维尔茨堡大学和亥姆霍兹人工智能合作单位(亥姆霍兹人工智能)合作,开发了一种使用数据集成和人工智能(AI)的机器学习方法,以改善未来的预测。

方法

CRISPRi筛选是一种高度敏感的工具,可用于研究基因表达减少的影响。在他们今天发表在杂志上的研究中基因组生物学,科学家们使用来自多个全基因组CRISPRi essentiality筛选的数据来训练一种机器学习方法。他们的目标是:更好地预测CRISPRi系统中部署的工程指导RNA的功效。

“不幸的是,全基因组筛选只能提供关于指南效率的间接信息。因此,我们应用了一种新的机器学习方法,将指导RNA的功效与沉默基因的影响分开,”Lars Barquist解释说这位计算生物学家发起了这项研究,并在维尔茨堡亥姆霍兹研究所领导一个生物信息学研究小组,该研究所是布伦瑞克亥姆霍兹感染研究中心与维尔茨堡朱利叶斯-马克西米利安大学合作的一个网站。

在其他人工智能工具(“可解释的人工智能”)的支持下,该团队为未来的CRISPRi实验建立了可理解的设计规则。研究作者通过进行一项针对必需细菌基因的独立筛选来验证他们的方法,表明他们的预测比以前的方法更准确。

“结果表明,我们的模型优于现有方法,并在针对特定基因时提供了更可靠的CRISPRi性能预测,”Lars Barquist研究小组的博士生、该研究的第一作者晏婴·于说。

科学家们特别惊讶地发现,指导RNA本身并不是决定CRISPRi在重要性筛选中耗尽的主要因素。Yu解释说:“与基因表达相关的某些基因特异性特征似乎比以前假设的影响更大。”

该研究还表明,整合来自多个数据集的数据显著提高了预测准确性,并能够更可靠地评估指导RNA的效率。“通过整合多个实验来扩展我们的训练数据对于创建更好的预测模型至关重要。在我们的研究之前,缺乏数据是预测准确性的主要限制因素,”初级教授Barquist总结道。现在发表的方法将非常有助于规划未来更有效的CRISPRi实验,并为生物技术和基础研究服务。Barquist说:“我们的研究为开发更精确的工具来操纵细菌基因表达提供了蓝图,并最终有助于更好地了解和对抗病原体。”

结果一目了然

基因特征至关重要:目标基因的特征对全基因组筛选中的指导RNA耗尽有重大影响。

数据整合改善预测:结合来自多个CRISPRi筛选的数据可显著提高预测模型的准确性,并实现对guide RNA效率的更可靠估计。

设计更好的CRISPRi实验:该研究通过预测guide RNA的效率为设计更有效的CRISPRi实验提供了宝贵的见解,从而实现了精确的基因沉默策略。

提供资金

这项研究得到了巴伐利亚州科学和艺术部的资助bayresq.net研究网络。


来源: Materials provided by Helmholtz Centre for Infection Research.
注明: Content may be edited for style and length. Journal Reference: Yanying Yu, Sandra Gawlitt, Lisa Barros de Andrade e Sousa, Erinc Merdivan, Marie Piraud, Chase L. Beisel, Lars Barquist. Improved prediction of bacterial CRISPRi guide efficiency from depletion screens through mixed-effect machine learning and data integration. Genome Biology, 2024; 25 (1) DOI: 10.1186/s13059-023-03153-y
排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567