密歇根大学研究人员的一项新研究表明,一种使用简单、成本效益高的实验和机器学习模型的蛋白质工程方法可以预测哪些蛋白质对特定目的有效
该方法在组装蛋白质和肽方面具有深远的潜力,可用于从工业工具到治疗学的应用。例如,这项技术可以帮助加快稳定肽的开发,以目前药物所不能的方式治疗疾病,包括改善抗体在免疫疗法中与靶点的特异性结合
密歇根大学化学工程博士毕业生、该研究的第一作者Marshall Case说:“控制蛋白质如何工作的规则,从序列到结构再到功能,都非常复杂。为蛋白质工程的可解释性做出贡献尤其令人兴奋。”
目前,大多数蛋白质工程实验使用复杂、劳动密集的方法和昂贵的仪器来获得非常精确的数据。漫长的过程限制了可以获取的数据量,复杂的方法很难学习和执行;精确性的权衡
“我们的方法已经表明,对于许多应用,你可以避免这些复杂的方法,”Case说,他现在是Manifold Biotechnologies的计算生物学家更新后的方法首先将细胞分为两组,称为二元排序,根据它们是否表达所需的特征—如与荧光分子结合—或者不。然后,对细胞进行测序,以获得感兴趣蛋白质的潜在DNA编码。然后,机器学习算法降低测序数据中的噪声,以识别尽可能好的蛋白质
密歇根大学化学工程副教授、该论文通讯作者Greg Thurber说:“与其从图书馆里挑选‘最好的书’,不如读很多书,然后把不同故事中的不同页面拼凑起来,尽可能选出最好的书,即使它不在你原来的图书馆里。”。“使用简单的二进制排序数据,我很惊讶地看到了这项技术的稳健性。”
该方法使用线性机器学习模型,与具有数十个参数的模型相比,更容易解释,进一步增强了其可访问性
Case说:“因为我们可以了解蛋白质实际工作的物理规则,所以我们可以使用线性方程来模拟蛋白质的非线性行为,并以此方式制造更好的药物。”这项研究发表在《美国国家科学院院刊》上,在结构生物学、生物质谱设备和蛋白质组学研究中心的高级基因组核心进行;肽合成核心
Journal information: Proceedings of the National Academy of Sciences
Provided by University of Michigan
2024-09-15
2024-09-15
2024-09-15
2024-09-15
2024-09-15