研究人员开发了一个将自动实验与人工智能相结合的平台,以预测化学物质之间的反应,这可能会加快新药的设计过程。
预测分子如何反应对于新药的发现和制造至关重要,但从历史上看,这是一个反复试验的过程,反应经常失败。为了预测分子将如何反应,化学家通常在简化的模型中模拟电子和原子,这一过程计算量大且通常不准确。
现在,来自剑桥大学的研究人员受基因组学的启发,开发了一种数据驱动的方法,将自动化实验与机器学习相结合,以了解化学反应性,大大加快了这一过程。他们称他们的方法为化学“反应组”,该方法在超过39,000个药物相关反应的数据集上得到验证。
他们的结果发表在杂志上自然化学,是剑桥和辉瑞合作的产物。
“reactome可能会改变我们对有机化学的看法,”来自剑桥卡文迪许实验室的艾玛·金-史密斯博士说,她是论文的第一作者。“对化学的更深入了解可以使我们更快地制造药物和许多其他有用的产品。但更根本的是,我们希望产生的理解将有益于任何从事分子工作的人。”
reactome方法从数据中挑选出反应物、试剂和反应性能之间的相关关系,并指出数据本身的差距。数据是从非常快速或高通量的自动化实验中生成的。
“高通量化学已经改变了游戏规则,但我们相信有一种方法可以比高通量实验的初步结果更深入地了解化学反应,”金-史密斯说。
“我们的方法揭示了反应成分和结果之间的隐藏关系,”领导这项研究的阿尔法·李博士说。“我们训练模型的数据集是庞大的-它将有助于将化学发现的过程从试错带入大数据时代。”
在发表于的一篇相关论文中《自然·通讯》该团队开发了一种机器学习方法,使化学家能够对分子的预先指定区域进行精确转换,从而加快药物设计。
这种方法允许化学家调整复杂的分子-就像最后一刻的设计变更-而不必从头开始制造它们。在实验室制造一个分子通常是一个多步骤的过程,就像盖房子一样。如果化学家想改变分子的核心,传统的方法是重建分子,比如推倒房子,从头开始重建。然而,核心变异对药物设计很重要。
一类被称为后期功能化反应的反应试图直接将化学转化引入核心,避免从头开始。然而,使后期功能化具有选择性和可控性具有挑战性——分子中通常有许多区域可以反应,并且很难预测结果。
金-史密斯说:“后期的功能化可能会产生不可预测的结果,目前的建模方法,包括我们自己的专家直觉,并不完美。”“一个更具预测性的模型将为我们提供更好的筛查机会。”
研究人员开发了一种机器学习模型,可以预测分子在哪里反应,以及反应位置如何随着不同反应条件的变化而变化。这使得化学家能够找到精确调整分子核心的方法。
金-史密斯说:“在对模型进行微调以预测这些复杂的转变之前,我们对大量光谱数据进行了预处理——有效地教授了模型普通化学。”这种方法使团队能够克服低数据的限制:科学文献中报道的后期功能化反应相对较少。该团队在一组不同的类药分子上实验验证了该模型,并能够准确预测不同条件下的反应位点。
“与化学空间的浩瀚相比,数据量较小的问题往往限制了机器学习在化学领域的应用,”Lee说。“我们的方法——设计从与我们试图解决的问题相似但不相同的大型数据集学习的模型——解决了这一基本的低数据挑战,并可能实现后期功能化以外的进步。”
这项研究得到了辉瑞和皇家学会的部分支持。
2024-01-20
2024-01-20
2024-01-20
2024-01-20
2024-01-20