内在无序蛋白质(IDPs)不能获得稳定的二级或三级结构,并迅速改变其构象,这使得结构预测特别具有挑战性。尽管这些蛋白质表现出混乱和“无序”的结构,但它们仍然具有基本功能
IDPs约占人类蛋白质组的30%,在转录、翻译和信号传导中起着重要的功能作用。许多与神经系统疾病相关的突变,包括肌萎缩侧索硬化症(ALS),都位于内在紊乱的蛋白质区域(IDR)
强大的机器学习算法,包括AlphaFold和RoseTTAFold,无法提供这些“无序”和“混乱”蛋白质区域作为一个整体的真实表示。这是因为它们没有经过这样的数据训练,而且这些蛋白质表现出固有的动态行为,采用一系列构象而不是单一的稳定构象
现在,来自BSRC Fleming和剑桥大学错误折叠疾病中心的一组研究人员发现了一种有效的方法来预测以前被认为“黑暗”且难以观察的所有人类蛋白质中很大一部分的结构
该团队开发并使用了一种名为“AlphaFold Metainference”的算法,该算法基于可用蛋白质结构数据库和分子动力学模拟的数据进行训练。这项研究的结果最近发表在《自然通讯》上
“AlphaFold通过提供蛋白质结构的准确预测改变了结构生物学。我们现在展示了如何将这些预测扩展到IDPs,IDPs约占人类蛋白质组的三分之一,几乎与所有主要疾病有关,”剑桥大学错误折叠疾病中心生物物理学教授Michele Vendruscolo说
“我们惊讶地发现,尽管AlphaFold不能准确预测IDPs的三维结构,但它可以非常准确地预测氨基酸之间的距离。然后,我们将这些信息纳入分子动力学模拟中,使我们能够准确预测这些无序蛋白质所采用的三维结构及其运动,”生物医学科学研究中心“亚历山大·弗莱明”(BSRC Fleming)生物创新研究所Georgios Skretas博士实验室的高级博士后研究员、该研究的第一作者Faidon Brotzakis博士解释道
该算法在含有无序和非无序区域的蛋白质上进行了测试,包括TDP-43(与ALS相关)、ataxin-3(与Machado-Joseph病相关)和朊病毒蛋白(与克雅氏病有关)
Brotzakis博士解释说:“我们在总共11个IDPs和6个PDP上测试了该算法,但我们特别关注与严重疾病相关的蛋白质。在所有情况下,该算法的准确性都优于AlphaFold。事实上,在80%的情况下,它与分子动力学模拟的准确性相匹配或超过。这表明该算法在IDPs的结构表征方面具有优势。”
科学家们现在有了一种更快、更准确的方法来确定无序蛋白质的结构,特别是在没有实验数据的情况下。Brotzakis说:“未来,我们可以利用这些信息发现可以与这些蛋白质强烈相互作用并改变其动力学的药物分子。这可以防止它们有问题地折叠成有毒形式,如淀粉样纤维,这在许多神经退行性疾病中都有观察到。”
接下来的步骤是将该算法应用于其他生物分子,如DNA和RNA
Journal information: Nature Communications
Provided by Biomedical Sciences Research Center Alexander Fleming
2025-03-15
2025-03-15
2025-03-15
2025-03-15
2025-03-15