新的人工智能模型增强了医学研究的蛋白质数据分析

Researchers have developed new AI models that can vastly improve accuracy and discovery within protein science. The models could assist the medical sciences in overcoming present challenges within personalized medicine, drug discovery, and diagnostics.

研究人员开发了新的人工智能模型,可以大大提高蛋白质科学的准确性和发现能力。这些模型可以帮助医学科学克服个性化医疗、药物发现和诊断方面的当前挑战

随着人工智能工具的广泛使用,技术和自然科学的大多数领域都在迅速发展。在生物技术领域尤其如此,人工智能模型为药物发现、精准医学、基因编辑、食品安全和许多其他研究领域的突破提供了动力

一个子领域是蛋白质组学——大规模研究蛋白质——其中大量的蛋白质数据被收集在数据库中,可以与样本进行比较。这些数据库使科学家能够辨别样本中存在哪些蛋白质,从而辨别微生物。它们允许医生诊断疾病,监测治疗的有效性,或识别患者样本中存在的病原体

尽管这些工具有用且有效,但它们的作用是有限的,DTU生物工程副教授兼通讯作者Timothy Patrick Jenkins说:

“首先,没有数据库包含所有内容,所以你需要知道哪些数据库与你的特定需求相关。然后,深度搜索非常耗时,需要大量的计算机能力。最后,几乎不可能识别尚未注册的蛋白质。”

因此,一些小组研究了所谓的“从头测序算法”,随着数据库大小的增加,这些算法提高了准确性并降低了计算成本。尽管如此,来自DTU、荷兰代尔夫特大学和英国人工智能公司InstaDeep的Jenkins及其同事表示,他们的表现仍然“令人印象深刻”。

在《自然机器智能》杂志的一篇新论文中,他们提出了两种新的人工智能模型,以帮助研究人员、医疗从业者和商业实体在海量数据中准确找到必要的信息。这些被称为InstaNovo和InstaNovo+,研究人员可以通过InstaDeep网站获得

InstaDeep的研究工程师、该论文的共同第一作者Kevin Michael Eloff说:“综合来看,我们的模型超越了最先进的技术,比目前可用的工具精确得多。此外,正如我们在论文中所展示的,我们的模型并不特定于某个研究领域。相反,这些工具可以推动所有涉及蛋白质组学的领域取得重大进展。”

为了评估他们的模型的有用性,研究人员在主要感兴趣的领域内对它们进行了训练和测试

对下肢静脉性溃疡患者的伤口液进行了一项调查。众所周知,腿部静脉溃疡很难治疗,而且经常变成慢性溃疡,因此了解存在哪些微生物(如细菌)对治疗至关重要

这些模型可以绘制10倍于数据库搜索的序列,包括大肠杆菌和铜绿假单胞菌的序列,后者是一种多药耐药细菌

另一个用例是在细胞表面显示的称为肽的小块蛋白质上进行的。这些帮助免疫系统识别感染和疾病,如癌症。InstaNovo模型鉴定了数千种使用传统方法无法发现的新肽

与超过100000名依赖Phys.org获取日常见解的订阅者一起探索科学、技术和太空的最新进展。注册我们的免费时事通讯,每天或每周获取重要突破、创新和研究的最新进展

在个性化的癌症治疗中,增强免疫系统——也称为免疫治疗——这些肽都是潜在的攻击目标

“综合来看,我们对复杂病例的模型测试表明,这些病例适合显著提高我们的理解,例如,存在未知蛋白质,或者我们对所涉及的生物体没有先验知识。这对生物医学来说是个好兆头,因为它可以直接改善我们微生物组的识别,以及改善我们在个性化医学和癌症免疫学方面的努力,”DTU生物工程的第一作者兼助理教授康斯坦丁诺斯·卡洛杰罗普洛斯说。

该论文提供了六个额外的病例,展示了这些模型如何改进治疗测序、发现新肽、检测未报告的生物体以及显著增强蛋白质组学搜索。Timothy Patrick Jenkins说,他们的研究结果的影响远远超出了医学科学:

“从纯粹的技术、科学角度来看,有了这些工具,我们确实可以提高对整个生物世界的理解,不仅在医疗保健方面,而且在工业和学术界。

“在使用蛋白质组学的每个领域——无论是植物科学、兽医科学、工业生物技术、环境监测还是考古学——我们都可以获得迄今为止无法获得的蛋白质景观的见解。p