通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 动物植物

研究人员在人工智能的帮助下发现了未知分子

本站发布时间:2025-05-28 19:59:38

研究人员开发了一种名为DreaMS的机器学习模型,该模型显著加速了对以前未知分子的分析。该研究发表在《自然生物技术》上。

该团队包括今年神经元奖的年轻有前途的科学家得主,来自IOCB布拉格的TomášPluskal博士,以及他的学生Roman Bushuiev和来自捷克技术大学捷克信息学、机器人学和控制论研究所的同事,JosefŠivic博士和Anton Bushuief。

大自然中充满了尚未被发现的化学物质。据信,绝大多数天然分子仍然未知。描述它们可以为新药、更环保的杀虫剂、对生物过程的更深入理解或对宇宙中生命的更高级研究铺平道路。

每种物质都有一种独特的模式,类似于人类指纹,称为质谱,可以使用称为质谱的方法捕获。尽管这种方法会产生大量数据,但解释它并揭示确切的分子结构是极其困难的。由此产生的数据集通常表现为没有明显意义的庞大数字表。

为了解开未知分子的谜团,IOCB和CIIRC CTU的团队转向了人工智能。就像ChatGPT等大型语言模型在不事先知道单词含义的情况下学习理解语言一样,DreaMS模型试图在不事先了解其化学结构的情况下解释质谱。

IOCB Prague和CIIRC CTU的研究人员在人工智能的帮助下发现了未知分子

“ChatGPT可以从大量文本中推断单词的含义及其之间的联系,而DreaMS神经网络使用自监督机器学习,学习识别光谱中隐藏的分子结构。它利用了数百万个例子的数据,”Šivic解释道。

“DreaMS模型基于来自不同生物和环境(植物、微生物、食物、组织和土壤样本)的数千万个光谱进行训练。因此,它可以揭示光谱之间隐藏的相似之处,乍一看,这些相似之处似乎无关,”Pluskal说。

结果是一个相互连接的网络,有助于浏览大量的化学数据。这个可以想象为质谱互联网的网络被命名为DreaMS Atlas。每个频谱就像一个链接到其他频谱的网站。

在这个“光谱互联网”上,用户可以搜索、探索发现的联系,并提出新的问题——例如:杀虫剂、食物和人类皮肤有什么共同点?

DreaMS发现了它们之间意想不到的化学相似性,并假设某些杀虫剂可能与牛皮癣等自身免疫性疾病有关。

除了连接不同研究的光谱外,DreaMS还可以用于各种实际任务,例如,估计分子包含多少特定片段或是否包含特定的化学元素。Bushuiev说:“我们特别惊讶的是,该模型学会了检测氟。”。

“大约三分之一的药物和农用化学品中都含有氟,但我们以前无法从质谱中可靠地检测到它。在对数百万个光谱对DreaMS进行预训练后,我们用几千个含氟分子的例子对其进行了微调,突然间它奏效了。”

研究人员现在正在进行下一步工作:教授模型预测整个分子结构。如果成功,它可能会从根本上改变我们对化学多样性的理解,无论是在地球上还是在其他星球上。p

More information: Roman Bushuiev et al, Self-supervised learning of molecular representations from millions of tandem mass spectra using DreaMS, Nature Biotechnology (2025). DOI: 10.1038/s41587-025-02663-3

Journal information: Nature Biotechnology

Provided by Institute of Organic Chemistry and Biochemistry of the CAS

排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567