DeepEvo:一种“智能”的定制蛋白质工程策略

Engineering proteins for desirable traits has been the holy grail of modern biotechnology. For example, the food industry can benefit from engineered enzymes which have the ability to enhance biochemical reactions at higher temperatures, as compared to na

将蛋白质工程化以获得理想的特性一直是现代生物技术的圣杯。例如,食品工业可以受益于工程酶,与天然酶相比,工程酶具有在更高温度下增强生物化学反应的能力。这可以节省宝贵的资源,如劳动力、金钱和时间。然而,获得具有所需特性的感兴趣的功能蛋白的过程面临着重大挑战

当前的蛋白质工程方法,如定向进化,在很大程度上依赖于缩小感兴趣蛋白质的理想变体的机会。定向进化使用称为突变的蛋白质序列改变的重复引入(迭代诱变),然后快速筛选大量变异蛋白质(高通量筛选)。毫不奇怪,这种方法劳动密集且效率低下

为了克服这些局限性,由中国科学院天津工业生物技术研究所和国家合成生物学技术创新中心的姜惠峰博士领导的一组来自中国的研究人员开发了一种基于人工智能的蛋白质工程策略,称为“DeepEvo”。江博士进一步解释说,“DeepEvo使用了一种深度进化策略,将深度学习(一种模拟活体大脑功能的过程)和进化生物学的原理相结合。”该研究于2024年3月20日在线发表在《生物设计研究》上。(G3PDH)。G3PDH在活细胞的糖酵解过程中分解葡萄糖以产生能量。当该团队通过实验验证DeepEvo的结果时,他们获得了超过26%的有希望的成功率

在这项研究中,DeepEvo使用的数据涉及具有不同最佳生长温度(OGT)的生物体序列和具有所需功能的天然序列。开发的DeepEvo策略包括选择器(Thermo-selector)和变体生成器(variant generator),以产生结合所需性状的功能蛋白序列

当选择器作为选择性压力来富集所需的蛋白质序列时,变体生成器产生了这些序列——在这种情况下,是具有高温耐受性的G3PDH变体。用OGT标记的序列训练Thermo选择器,而那些具有所需功能的序列训练Variant生成器。Thermo选择器过滤序列,引导Variant生成器

值得注意的是,蛋白质语言模型——一种深度学习模型——构成了本研究中使用的Thermo选择器的基础。这样的模型是在大量真实世界的蛋白质序列数据上训练的,以学习这些序列中固有的模式和特征。这种开发的选择器使用蛋白质序列的学习表示来指导具有所需特征的序列的生成和选择

此外,研究人员通过涉及生成器和选择器的迭代过程,在蛋白质序列中积累了耐高温特性。预测为耐高温的序列的迭代精化形成了序列生成的循环

江博士进一步解释道,“DeepEvo的迭代过程模拟了自然选择过程,在自然选择过程中,功能序列在连续几代中得到青睐和积累,最终导致具有所需特性的蛋白质变体的发展。”。从生成的30个序列中,他们获得了8个变体,从而突出了DeepEvo在工程耐高温蛋白质方面的高效性

展望未来,DeepEvo可以帮助选择感兴趣的各种性状,而不仅仅是耐高温性。对此,姜博士表示,“我们可以将DeepEvo方法应用于其他蛋白质特性的工程,如酸碱耐受性、催化活性和抗原亲和力,促进具有多种所需特性的新蛋白质的产生。”。为所需性状定制的蛋白质的简单高效生产可能很快就会成为现实