通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 动物植物

使用三种人工智能蛋白质预测工具,研究揭示了“孤儿”蛋白质折叠故事中的新皱纹

本站发布时间:2024-02-18 16:52:24

当教授。Joel Sussman和Israel Silman被要求在新冠肺炎大流行期间在线指导中国学生,他们最不希望从这次经历中得到的是对蛋白质进化的高度创新研究,这可能会改变我们对新蛋白质产生方式的理解

Sussman回忆道:“一开始我很怀疑——他们都是本科生,通过电脑屏幕交流似乎不太有希望。”。但他和西尔曼(Weizmann Institute of Science教授二人组)同意为来自中国顶尖大学的四名学生组成的团队提供辅导。西尔曼对蛋白质结构和功能进行了数百项联合研究。在线辅导是宇春魏兹曼计划的一部分,由魏兹曼的严炳海教授领导

Sussman和Silman告诉学生直呼其名,这在中国大学是闻所未闻的做法,并鼓励他们培养批判性思维。尽管如此,当他们要求学生复习他们关于蛋白质序列变异的一篇旧论文时,他们只希望得到一个尊重的总结。相反,学生们带着深入的批评回来了,从当代的角度分析了这项研究,并建议可以使用新的方法修改其中的一些结论

四名学生之一的刘静(音译)说,对她和其他学生来说,这与他们过去的习惯大相径庭。她解释道:“在中国,攻读硕士学位的学生不能挑战博士生或博士后,他们可能会生气或告诉首席研究员。”。然而,她很快注意到,当时她就读的以色列理工学院广东校区的环境有所不同。“我有一位导师愿意听我说话并进行讨论,这在中国其他大学很难找到。”

令双方惊讶的是,在线教程很快就变成了讨论。2017年,捷克科学家的一项研究引起了刘导师的注意,这项研究成为了人们思考的一个主要话题——这暗示了蛋白质进化史上一个有趣的转折

折叠法则的裂缝

随着曾经居住在地球上的单细胞生物进化成更复杂的生物,如果这些变化是有益的,它们DNA中的偶然变化往往会由于自然选择而被保存,并传递给高等生物。这就是为什么我们体内的大多数蛋白质编码基因在进化树上的许多其他物种中都有等价物(科学术语是“同源物”),一直追溯到酵母或细菌。随着蛋白质的发展,其中许多开始折叠成复杂的结构,使它们能够执行专门的任务

考虑到自然选择已经发挥了数十亿年的作用,蛋白质似乎有足够的时间进化出所有可能有用的序列。事实上,直到最近,科学家们还认为所有现有的蛋白质都是通过对现有序列的细化而产生的,而真正新的蛋白质早就不再出现了

但就在十多年前,这一科学福音开始出现裂痕:有证据表明,新的蛋白质一直在不断诞生。当科学家们开始对各种生物体的整个基因组进行测序时,比较显示,从细菌到人类,所有物种都存在编码“新生”蛋白质的基因。这些蛋白质被认为起源于构成基因组大部分的非编码区。在这种情况下,一段缺乏蛋白质配方的DNA偶然获得了一组突变,将其转化为蛋白质编码基因

刘和她的导师们对捷克的研究引起了极大的兴趣,这为这一教条打开了一条新的裂缝。捷克研究人员通过像一副卡片一样随机重组现有的蛋白质基因,创建了大约100个假设蛋白质序列。当他们合成这些“从未出生”的蛋白质并在实验室进行测试时,他们发现大约三分之一的蛋白质有折叠成紧凑结构的迹象,就像天然蛋白质一样

“这真是太神奇了,”Sussman说。“如果以前有人问我一个随机的蛋白质序列是否可以这样折叠,我会说永远不会。”

Silman解释说,蛋白质的折叠能力对生命至关重要。虽然不是所有的蛋白质都折叠,但折叠的蛋白质,即那些具有有序片段的蛋白质,在生物体中发挥关键的催化功能。捷克的研究表明,“从未出生”的蛋白质可以折叠,这表明新的蛋白质不仅可以出生,而且可能发挥重要的新作用

天生的孤儿

非编码的DNA片段是如何变成“新生”蛋白质的,这种蛋白质是如何变得活跃的?这些过程的时间尺度是多少?这些机制有一天能在蛋白质设计中得到利用吗

为了帮助解决这些问题,Sussman和Silman决定进行最早的新生蛋白质结构研究之一。他们与该论文的第一作者刘和当时就读于北京清华大学的袁荣庆共同发起了这个项目。四人在完成这项研究之前在线会面了一年半,该研究最近发表在《蛋白质:结构、功能和生物信息学》杂志上。另外两名学生,邵伟和王继彤,参与了该项目的初始阶段;他们在预定的教程结束时退出了,但他们是已发表论文的合著者

该团队在人工智能(AI)工具的帮助下探索了“新生”蛋白质的折叠潜力,这些工具在过去几年里彻底改变了蛋白质结构的研究。在大多数情况下,这些算法现在都是可靠的

More information: Jing Liu et al, Do "Newly Born" orphan proteins resemble "Never Born" proteins? A study using three deep learning algorithms, Proteins: Structure, Function, and Bioinformatics (2023). DOI: 10.1002/prot.26496

Provided by Weizmann Institute of Science

排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567