一种新的人工智能(AI)工具可以对未知蛋白质的功能进行逻辑推断,有望帮助科学家解开细胞的内部工作原理
该工具由KAUST生物信息学研究人员Maxat Kulmanov及其同事开发,在预测蛋白质功能方面优于现有的分析方法,甚至能够分析现有数据集中没有明确匹配的蛋白质
这项研究发表在《自然·机器智能》杂志上
该模型名为DeepGO SE,利用了与Chat GPT等生成人工智能工具使用的大型语言模型类似的大型语言模式。然后,它利用逻辑蕴涵,根据蛋白质工作方式的一般生物学原理,得出关于分子功能的有意义的结论。
它本质上使计算机能够通过构建世界一部分的模型——在这种情况下是蛋白质功能——来逻辑处理结果,并根据常识和对这些世界模型中应该发生的事情的推理,推断出最合理的场景
“这种方法有很多应用,”监督这项研究的KAUST生物本体研究小组负责人Robert Hoehndorf说,“尤其是当有必要对神经网络或另一个机器学习模型生成的数据和假设进行推理时。”
Kulmanov和Hoehndoff与KAUST的Stefan Arold以及瑞士生物信息学研究所的研究人员合作,评估该模型破译未知蛋白质在体内作用的功能的能力
该工具成功地使用了关于一种鲜为人知的蛋白质的氨基酸序列及其与其他蛋白质的已知相互作用的数据,并准确地预测了其分子功能。该模型非常准确,在一场函数预测工具的国际竞赛中,DeepGO SE在1600多种算法中排名前20
KAUST团队现在正在使用该工具研究在沙特阿拉伯沙漠极端环境中生长的植物中发现的神秘蛋白质的功能。他们希望这一发现将有助于识别用于生物技术应用的新型蛋白质,并希望其他研究人员接受这一工具
正如Kulmanov所解释的,“DeepGO SE分析未表征蛋白质的能力可以促进药物发现、代谢途径分析、疾病关联、蛋白质工程、感兴趣的特定蛋白质筛选等任务。”
Journal information: Nature Machine Intelligence
Provided by King Abdullah University of Science and Technology
2025-05-13
2025-05-13
2025-05-13
2025-05-13
2025-05-13