研究人员开发了高度准确的碳水化合物结合位点预测算法DeepGlycanSite

As the most abundant organic substances in nature, carbohydrates are essential for life. Carbohydrates interact with diverse protein families to modulate various biological processes, including immune response, cell differentiation and neural development.

碳水化合物作为自然界中最丰富的有机物质,对生命至关重要。碳水化合物与不同的蛋白质家族相互作用,调节各种生物过程,包括免疫反应、细胞分化和神经发育

了解碳水化合物如何在生理和病理过程中调节蛋白质,为解决关键的生物学问题和开发新的治疗方法提供了机会。然而,碳水化合物的多样性和复杂性对实验确定碳水化合物与蛋白质结合并作用于蛋白质的位点提出了挑战

因此,开发可靠的碳水化合物结合位点预测因子对于揭示碳水化合物-蛋白质相互作用至关重要

在《自然通讯》上发表的一项研究中,由中国科学院上海药物研究所(SIMM)的程Xi和温柳青领导的一个研究团队,来自Lingang实验室的王定燕和合作者,介绍了一种新的碳水化合物结合位点预测因子DeepGlycanSite。这种预测因子优于以前最先进的方法,并有效地预测了不同碳水化合物的结合位点

<p>DeepGlycanSite将蛋白质的几何和进化特征结合到具有转换器结构的深度等变图神经网络中,能够准确预测给定蛋白质结构上的碳水化合物结合位点

研究人员在涉及100多种独特碳水化合物结合蛋白的独立测试集上,将DeepGlycanSite与最先进的结合位点预测因子进行了比较。DeepGlycanSite的平均Matthews相关系数(MCC)和精密度大于0.62,而所有替代方法的平均MCC都很小,精密度小于0.35。

对于单糖或二糖结合位点的预测,DeepGlycoanSite显示的平均MCC和精密度是替代方法的两倍多。对于寡糖或核苷酸结合位点的预测,DeepGlycanSite的平均MCC和精度仍超过0.60。总的来说,DeepGlycanSite在各种碳水化合物结合位点预测中表现出了出色的性能,突出了其普遍适用性

此外,DeepGlycanSite可以预测查询碳水化合物的特异性结合位点

研究人员建立了一个网络模型DeepGlycanSite+配体,以处理查询碳水化合物的蛋白质结构和二维化学结构,并添加了额外的模块来处理配体部分。DeepGlycanSite+配体可以区分属于不同类别的查询碳水化合物的特定结合位点,而以前最先进的方法在区分单、二或寡糖结合位点方面显示出无效

为了举例说明其应用,研究人员使用DeepGlycanSite+配体来鉴定功能重要的G蛋白偶联受体P2Y嘌呤受体14(P2Y14)上的特定碳水化合物结合位点。P2Y14调节免疫反应并与哮喘、肾损伤和肺部炎症相关

在钙动员测定中,发现鸟苷5'-二磷酸岩藻糖(GDP-Fuc)可激活人P2Y14。作为哺乳动物的必需糖核苷酸,GDP-Fuc与各种癌症的肿瘤生长和转移密切相关。GDP Fuc诱导的P2Y14活化以前没有报道过。因此,GDP Fuc如何作用于该受体尚不清楚

研究人员使用DeepGlycanSite鉴定G80、D81和N90形成P2Y14的鸟苷-5’-二磷酸糖识别位点,并在诱变研究中验证了这一发现

DeepGlycanSite不仅有助于破译碳水化合物和碳水化合物结合蛋白的生物学功能,而且为开发碳水化合物药物提供了强大的工具