深度学习框架推进空间转录组学中的组织分析

Biological tissues are made up of different cell types arranged in specific patterns, which are essential to their proper functioning. Understanding these spatial arrangements is important when studying how cells interact and respond to changes in their e

生物组织由以特定模式排列的不同细胞类型组成,这对其正常运作至关重要。在研究细胞如何相互作用并对环境变化做出反应,以及癌症等复杂的病理学时,了解这些空间排列非常重要

空间转录组学(ST)技术在过去十年中迅速发展,使科学家能够绘制组织内的基因活性图,同时保持其结构完整,为健康和患病状态提供更深入的见解

然而,基于基因活性识别不同的组织区域仍然是一个挑战,因为不同的方法难以平衡遗传数据与空间组织。例如,一些ST方法依赖于任意定义的距离参数,这可能无法准确反映生物边界。其他方法结合了多个组织图像以提高准确性,但受到图像质量和数据可用性不一致的限制

此外,由于技术差异,比较来自不同实验的图像数据可能很困难,通常需要手动调整以正确对齐数据集并实现批量集成

为了解决这些问题,日本东京大学医学研究所的中井健田教授领导的一个研究小组开发了一个名为“通过图像辅助图形对比学习进行空间转录组学分析”(STAIG)的深度学习框架

他们的研究在线发表在《自然通讯》2025年版上,介绍了STAIG框架,该框架整合了基因表达、空间数据和组织学图像,无需手动对齐,从而产生了出色的结果

这项研究是由Nakai教授实验室的几位人士共同撰写的,特别是他指导下的博士生Yitao Yang

STAIG通过将组织图像分割成小块并使用自监督模型提取特征来处理组织图像,从而消除了大量预训练的需要。然后,它根据这些特征构建了一个图形结构,战略性地整合空间信息,以有效地管理垂直堆叠的图像

在这些图中,节点表示基因表达数据,而边反映空间邻接性。STAIG使用一种称为图形对比学习的先进方法来识别关键的空间特征,使其能够将不同的基因表达模式映射到特定的组织区域

Nakai说:“STAIG利用强大的模型架构和额外的图像数据来实现高精度的空间域识别,同时还可以实现批量集成,而无需对齐组织切片或进行手动调整。”他概述了该模型的一些主要优势

研究小组进行了广泛的基准评估,将STAIG与其他最先进的ST技术进行了比较。结果表明,STAIG在各种条件下都表现出色,包括空间对齐不可用或组织学图像缺失的情况

在人类乳腺癌症和斑马鱼黑色素瘤的数据集中,STAIG成功地以高分辨率识别了空间区域,包括现有方法难以检测的具有挑战性的区域。此外,它精确地描绘了肿瘤边界和过渡区,显示了其在癌症研究中的潜力

研究人员对他们提出的框架及其在医学研究和生物学中的潜在应用寄予厚望

Nakai总结道:“STAIG将加速空间转录组数据的使用,以了解生物系统的复杂结构,包括癌症细胞及其周围细胞之间的相互作用以及发育中胚胎器官的形成。”

“我们的研究将增强我们对大脑如何工作、癌症细胞如何发育以及我们的身体是如何构建的理解。这些知识将促进各种疾病新治疗方法的开发。”