在《生物学101》中,我们了解到RNA是一条带状的碱基对链,从我们的DNA中复制出来,然后像构建蛋白质的食谱一样阅读。但故事还有更多。一些RNA链折叠成复杂的形状,使其能够驱动基因调控和蛋白质合成等细胞过程,或催化生化反应。
我们知道这些被称为非编码RNA的活性分子存在于所有生命形式中,但我们才刚刚开始了解它们的许多作用,以及如何利用它们在环境科学、农业和医学中的应用。
为了研究并可能修改非编码RNA的功能,我们需要确定它们的结构。劳伦斯伯克利国家实验室(伯克利实验室)和耶路撒冷希伯来大学的科学家们开发了一种简化的过程,可以预测RNA分子的结构到原子水平。
研究界的成员可以来到伯克利实验室的高级光源(ALS)用户设施,只知道分子的核苷酸序列并获得结构,或者他们可以使用团队的开源软件自己完成。
伯克利实验室分子生物物理学和综合生物成像(MBIB)部门的科学家Michal Hammel说:“我们正在着眼于结构预测的大局,比如我们如何从A到Z,而不是研究A、B和D。这就是我们在伯克利实验室试图做的,让它变得用户友好。”。
Hammel与MBIB同事Scott Classen和希伯来大学合作者Dina Schneidman Duhovny和Edan Patt共同开发了这一过程,称为RNA的SOlution构象前体(SCOPER)。一篇描述SCOPER的论文最近发表在《生物物理杂志》上。
从历史上看,准确确定折叠RNA的三维原子蓝图是困难到不可能的,因为它们很少转化为整洁的晶体形式,用X射线晶体学进行成像。由于RNA链的扭曲和折叠随着分子的功能而移动,因此实际上有多个正确的结构。
近年来,像AlphaFold这样的人工智能工具在基于氨基酸序列生成蛋白质结构预测方面变得非常准确,使全球科学家的生活变得更加轻松,并大大加快了药物发现的步伐。
这些算法已经扩展到RNA结构,但准确性仍然处于中等水平。目前,获得可靠的模型需要将多个计算工具的输出和成像数据结合起来。这是一个漫长的过程,仍然充满了不确定性。
SCOPER大大简化了它。假设你想研究一种新的RNA:首先,将核苷酸序列放入目前可用的开源、基于人工智能的结构预测工具中。然后,将样品带到小角度X射线散射(SAXS)设施进行表征。更好的是,让Hammel和他在ALS SAXS波束线的同事为您获取这些数据。
获取SAXS数据和预测结构,并将其放入SCOPER的管道中。第一步使用现有程序从预测的静态结构中生成RNA的可能灵活排列。
与超过100000名依赖Phys.org获取日常见解的订阅者一起探索科学、技术和太空的最新进展。注册我们的免费时事通讯,每天或每周获取重要突破、创新和研究的最新进展。
接下来,Patt在现有原子结构上开发和训练了一个新的机器学习程序,通过添加镁离子的位置来细化结构。在细胞内,带正电的镁离子与带负电的RNA相互作用,使它们保持稳定折叠。它们的存在也有助于在使用SAXS时阐明结构。
然后SCOPER生成表示理论结构的模拟SAXS数据,并将其与现实世界的SAXS数据进行比较,以确定哪种结构是正确的。
最后,另一个软件程序对确认的结构在运行时可能采取的多种排列进行建模。用户不必自己控制多个软件工具,就可以获得一组精确的三维原子模型。
哈梅尔说:“如今,像AlphaFold这样的程序对蛋白质的准确率接近95%,但对RNA的准确率要低得多。它有时会提出五种不同的模型。现在的问题是,哪一种是正确的?”。“SCOPER可以告诉你。”
美国和欧洲的研究人员已经在使用这一过程,但该团队仍在努力使SCOPER更加方便。SIBYLS波束线上的计算集群可以运行SCOPER以及AlphaFold3等初始结构预测软件,因此用户不需要提前执行该步骤。
但是这个集群的能力是有限的,因此为了使其尽可能平稳和快速,Classen正在伯克利实验室国家能源研究科学计算中心(NERSC)用户设施的超级计算系统上安装管道。他的目标是在NERSC制作一个“漂亮整洁”的自包含应用程序,用户可以轻松操作。
完成后,研究人员可以使用SIBYLS自动波束线功能远程执行整个过程,使用户可以灵活地邮寄样本。然后,他们可以在线访问SCOPER。
伯克利实验室将成为可视化RNA溶液状态的一站式商店。p
Journal information: Biophysical Journal
Provided by Lawrence Berkeley National Laboratory
2025-05-15
2025-05-15
2025-05-15
2025-05-15
2025-05-15