想象一下,看着成千上万分散的拼图,试图猜测它们创造了什么画面。没有任何参考点,这几乎是不可能的。
同样,今天的生物学家在试图理解由分析数千个单个细胞的实验生成的巨大数据集时面临着重大挑战。手头有这么多基因组信息,但没有太多背景,很难理解这些数据是如何转化为人类健康和疾病的。
研究人员通过定义细胞类型来解决这个问题,类似于在组装之前决定如何按颜色或图案对拼图块进行分类。但是,正如如果你的伴侣使用不同的标准来对碎片进行分类,很难在谜题上进行合作一样,科学家们也一直受到如何比较不同研究中细胞类型的阻碍。
现在,Gladstone研究所的一个团队推出了一种强大的计算工具来解决这个问题。这项名为CellWalker2的新方法使科学家能够确定细胞类型之间的关系,并确定可能影响健康的细胞分组,从而更好地了解他们正在研究的细胞。“以前的方法没有利用细胞类型之间的关系,”Gladstone数据科学与生物技术研究所的L.K.Whittier主任Katie Pollard博士说,她领导了发表在《细胞基因组学》上的这项新研究。“使用我们的新工具,我们利用了一些细胞类型是兄弟姐妹而不是远房表亲的事实。”
揭示细胞类型之间的关系就像蓝天拼图可能被误认为是水片一样,看起来有些相似的未成熟和成熟神经元可能会被误认为不同的细胞类型。CellWalker2通过使用单元类型之间的层次关系来解决这个问题。该算法类似于您首先将拼图块分为“蓝色”等大类,然后将这堆拼图分成更小的子类型。
当收到一项新研究的基因组数据时,CellWalker2将能够识别精确的细胞类型,如果不能,它将分配一个更广泛的标签。“细胞类型不是随机的类别,”Pollard实验室的生物信息学研究员Zhirui Hu博士说,他帮助设计了新工具。
“有些是非常密切相关的,比如生命中略有不同阶段的两个兴奋性神经元,而另一些则是根本不同的,比如免疫细胞和肌肉细胞。CellWalker2考虑了这些关系。”
通过揭示细胞类型之间以及与控制它们的基因之间的关系,波拉德团队设计的新工具使科学家能够在不同的实验中匹配细胞类型,甚至来自不同的实验室或跨物种。
超越细胞标签单细胞数据分析是一个快速发展的领域,对揭示新的生物学见解具有深远的意义。波拉德和她的团队使用了一种名为“单细胞ATAC-seq”的相对较新技术的数据,该技术告诉科学家DNA的不同区域是多么开放或可访问。这很重要,因为可访问区域提供了单元格可能使用的指令。事实上,大多数疾病被认为是由可及区域的突变引起的。
与超过100000名依赖Phys.org获取日常见解的订阅者一起探索科学、技术和太空的最新进展。注册我们的免费时事通讯,每天或每周获取重要突破、创新和研究的最新进展。
但是ATAC-seq产生的数据很难解释。
几年前,当波士顿大学的Pawel Przytycki博士在Gladstone做博士后时,他和Pollard开发了CellWalker的原始版本来帮助分析这些数据。最初的工具将ATAC-seq数据与RNA测序配对,RNA测序提供了来自同一细胞类型的细胞中哪些基因是活跃的数据。
Pollard同时也是加州大学旧金山分校教授和旧金山Chan Zuckerberg生物中心的研究员,他说:“通过将这两种类型的数据结合起来,我们可以更容易地解释它。”。“CellWalker帮助我们从混乱的单细胞ATAC-seq数据转变为获得更清晰的信号,了解基因组的哪些部分在哪些细胞中是活跃的。”
现在,CellWalker2通过将来自同一细胞的多种类型的数据与有意义的生物学见解联系起来,扩展了这一愿景。这个额外的背景——比如看一眼拼图盒的封面——显示了每种细胞类型中哪些调控DNA是活跃的,以及不同数据集的细胞排列得有多紧密。然后,该工具量化了这些关系的强度,为研究人员提供了一种严格的方法来解释复杂的生物模式。
这种将DNA的调控元件(决定哪些基因被打开或关闭)与其细胞特异性功能联系起来的能力,对于理解自闭症、精神分裂症和先天性心脏病等疾病至关重要。
跨环境、物种和疾病进行比较为了证明CellWalker2的强大功能和灵活性,Pollard和她的团队首先使用它来比较来自不同人类免疫细胞研究的复杂数据。这些数据集是在不同的实验室使用不同的分析生成的。
“过去,比较不同研究中的细胞类型非常困难,因为实验室使用不同的方法和命名约定,”胡说。
>CellWalker2通过在细胞类型之间构建统计图克服了这一挑战,显示了一对一的匹配以及更广泛的关系,例如当一项研究中的单个细胞类型被归类为另一项研究的多种亚型时。Pollard和Hu还应用CellWalker2来精确定位特定免疫细胞类型使用的DNA调控区域。该工具能够超越简单地列出不同细胞中哪些基因被激活,而是推断出哪些调控区域和转录因子可能正在协调这些变化。
“有了这个工具,我们可以做的不仅仅是标记细胞,”胡说。“我们正在揭示细胞类型如何定义、它们之间的差异以及它们如何进化或发生故障背后的逻辑。”
最后,研究小组使用CellWalker2比较了人类、狨猴和小鼠的脑细胞。该工具揭示了哪些细胞类型在物种之间是共享的,哪些是独特的,从而提供了对大脑进化的洞察,以及是什么让人类大脑与众不同。
开源且随时可用CellWalker2已经可以在网上免费供其他研究人员使用;Przytycki和Hu创建了文档和示例数据来帮助新手用户。Pollard说,通过提供了解细胞如何运作和失败的新方法,CellWalker2等工具为开发未来的诊断和治疗奠定了重要基础。展望未来,她的团队设想使用新模型来解释与心脏和大脑疾病相关的基因组部分的功能,其中潜在机制仍然模糊不清。波拉德说:“我们终于到了一个地步,可以将疾病风险变异与它们所影响的实际调控程序和细胞类型联系起来。”。“CellWalker2是建立这些联系的关键一步。”
Journal information: Cell Genomics
Provided by Gladstone Institutes
2025-05-23
2025-05-23
2025-05-23
2025-05-23
2025-05-23