通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 前沿信息

微型蛋白质对可能掌握生命起源的关键

本站发布时间:2025-09-20 17:41:34
注:部分名称可能翻译不全,如有问题可联系15163559288@163.com

"我们发现遗传密码的起源神秘地关联于蛋白质组(即生物体内全部蛋白质的集合)的二肽组成,"通讯作者、伊利诺伊大学作物科学系、卡尔·R·沃斯基因组生物学研究所以及卡尔·伊利诺伊医学院生物医学与转化科学系教授古斯塔沃·卡埃塔诺-阿诺尔斯表示。

卡埃塔诺-阿诺尔斯的研究聚焦于系统发育组学——该学科致力于探究生物体基因组间的演化关系。他的研究团队先前构建了描绘蛋白质结构域(蛋白质中的结构单元)和转移RNA(tRNA,一种在蛋白质合成过程中向核糖体递送氨基酸的RNA分子)演化时间线的系统发育树。在本研究中,他们探索了二肽序列(由肽键连接两个氨基酸构成的基础模块)的演化过程,发现结构域、tRNA和二肽的演化历史完全吻合。

地球生命始于38亿年前,但基因和遗传密码直到8亿年后才出现,关于其形成机制存在多种竞争性理论。

部分科学家认为基于RNA的酶活性最先出现,而另一些学者提出蛋白质最初开始协同作用。卡埃塔诺-阿诺尔斯及其同事过去数十年的研究支持后一种观点,表明核糖体蛋白和tRNA相互作用在演化时间线上出现较晚。

卡埃塔诺-阿诺尔斯解释道,生命运行依赖于两个协同工作的密码。遗传密码将指令存储于核酸(DNA和RNA)中,而蛋白质密码则指导酶和其他分子维持细胞存活与运转。连接这两者的桥梁是核糖体——细胞的蛋白质工厂,它将tRNA分子携带的氨基酸组装成蛋白质。将氨基酸装载到tRNA上的酶称为氨酰tRNA合成酶。这些合成酶作为遗传密码的守护者,监控着整个系统的正确运作。

"为何生命依赖两种语言——一种用于基因,一种用于蛋白质?"卡埃塔诺-阿诺尔斯提出疑问。"我们仍不清楚这种双系统存在的原因,也不明白驱动两者连接的机制。驱动因素不可能存在于功能笨拙的RNA中。相反,蛋白质才是操控细胞精密分子机器的专家。"

蛋白质组似乎更适合承载遗传密码的早期历史,其中二肽作为蛋白质的早期结构模块发挥着尤为重要的作用。400种可能的二肽组合在不同生物体中的丰度存在差异。

 

研究团队分析了代表生命三大超界(古菌、细菌和真核生物)的1,561个蛋白质组中总计43亿个二肽序列的数据集。他们利用这些信息构建了二肽演化的系统发育树和年代序列。同时将二肽映射到蛋白质结构域系统树,以观察是否出现相似模式。

在前期工作中,研究者构建的tRNA系统发育树有助于提供氨基酸进入遗传密码的时间线,并根据出现时间将氨基酸分为三类:最古老的第1组包含酪氨酸、丝氨酸和亮氨酸;第2组包含另外8种氨基酸。这两组氨基酸与合成酶编辑功能的起源(该功能可校正氨基酸装载错误)及早期操作密码(确立首个特异性规则,确保每个密码子对应单一氨基酸)相关联。第3组包含后期出现的氨基酸,它们与标准遗传密码相关的衍生功能有关。

该团队已证实合成酶与tRNA的协同演化与氨基酸的出现相关。现在,他们可将二肽纳入分析体系。

"我们发现结果具有一致性,"卡埃塔诺-阿诺尔斯解释道。"一致性是系统发育分析的核心概念,意指通过一类数据获得的演化结论能得到另一类数据的印证。本研究检验了三类信息源:蛋白质结构域、tRNA和二肽序列。三者均揭示了氨基酸以特定顺序加入遗传密码的相同进程。"

另一新发现是二肽对出现的双重性。每个二肽由两个氨基酸组合而成(例如丙氨酸-亮氨酸AL),而其对称形式——反二肽——则呈现相反组合(亮氨酸-丙氨酸LA)。成对二肽具有互补性,可视作彼此的镜像。

"我们在系统发育树中发现了显著现象,"卡埃塔诺-阿诺尔斯指出。"大多数二肽与反二肽对在演化时间线上出现的时间点极为接近。这种同步性出乎意料。双重性揭示了遗传密码的基本特性,可能对生物学产生变革性影响。它表明二肽是在核酸基因组的互补链中编码产生的,很可能通过与原始合成酶相互作用的简约tRNA实现。"

二肽并非随机组合产生,而是作为影响蛋白质折叠与功能的关键结构元件出现。研究表明,二肽代表响应早期蛋白质结构需求而出现的原始蛋白质密码,与早期基于RNA的操作密码并存。这一过程由协同演化、分子编辑、催化作用及特异性共同塑造,最终催生出遗传密码的现代守护者——合成酶。

 

揭示遗传密码的演化根源深化了我们对生命起源的理解,并为基因工程、合成生物学及生物医学研究等现代领域提供了理论依据。

"合成生物学正认识到演化视角的价值。通过让自然规律指导设计,它强化了基因工程。理解生物组分和过程的古老性至关重要,因其凸显了它们的稳健性与抗变性。要进行有意义的改造,必须理解遗传密码的约束条件和内在逻辑,"卡埃塔诺-阿诺尔斯强调。

题为《追溯遗传密码与热稳定性起源至蛋白质组中的二肽序列》的论文发表于《分子生物学杂志》。作者包括王明磊(音译)、M·法耶兹·阿齐兹和古斯塔沃·卡埃塔诺-阿诺尔斯。

本研究获得美国国家科学基金会(MCB-0749836和OISE-1132791)、美国农业部(ILLU-802-909和ILLU-483-625)的资助,以及美国国家超级计算应用中心授予卡埃塔诺-阿诺尔斯的"蓝水"超级计算机资源配额支持。

Story Source:

Materialsprovided byUniversity of Illinois College of Agricultural, Consumer and Environmental Sciences.Note: Content may be edited for style and length.

Journal Reference:

Minglei Wang, M. Fayez Aziz, Gustavo Caetano-Anollés.Tracing the Origin of the Genetic Code and Thermostability to Dipeptide Sequences in Proteomes.Journal of Molecular Biology, 2025; 169396 DOI:10.1016/j.jmb.2025.169396

排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

北前院微信公众号