基于人工智能的方法使组织中成像的蛋白质数量呈指数级增长

AI systems already work their magic in many areas of biomedical science, helping to solve protein structure, discover hidden patterns in the genome and process massive amounts of biological data. Now, an AI-assisted technology developed at the Weizmann In

人工智能系统已经在生物医学的许多领域发挥了神奇的作用,帮助解决蛋白质结构,发现基因组中隐藏的模式,并处理大量的生物数据。现在,魏茨曼科学研究所开发并发表在《自然生物技术》上的一项人工智能辅助技术可能会为研究人员和医生提供一种前所未有的深入观察身体组织的方法,使他们能够在组织样本中同时观察到比以往更多的蛋白质

“要了解任何特定组织的工作原理,同时测量其大量蛋白质至关重要,”魏茨曼分子细胞生物学系的Leeat Keren博士说,他领导了该研究小组。“这让我们了解了组织中存在哪些细胞,以及它们如何相互交流和相互作用。”Keren解释说,这一知识对疾病过程的研究至关重要。例如,癌性生长除了肿瘤细胞外,还含有各种其他细胞类型,包括肿瘤生长所在组织和免疫系统的健康细胞。肿瘤的细胞组成以及这些细胞类型如何相互作用可以决定治疗的有效性,或用于预测哪些患者预后更好,哪些患者可能发生转移。反过来,这些发现可以改善个性化治疗

魏茨曼研究所的这项名为CombPlex的新技术为组织细胞组成的研究提供了重大飞跃。与一次仅从三到四种蛋白质中捕获数据的传统方法不同,CombPlex在概念验证阶段已经证明了同时对单个细胞内近二十种蛋白质进行成像和定量的能力,并有可能在未来将这种能力扩展到数百种蛋白质。该技术不需要额外的仪器,使其易于使用

寻找一张快照

传统方法的局限性源于光的光学特性。在过去的几十年里,用于标记蛋白质的荧光探针极大地推进了蛋白质研究,但当同一组织样本中的几种蛋白质被不同颜色的探针标记时,玻璃纸状的颜色可能会重叠,使显微镜图像变得混乱

一种解决方法是重复成像几次,每次都要洗掉现有的标签并放置新的标签。但这种被称为循环荧光的方法很耗时,它最终最多只能对几十种蛋白质进行成像——在人类基因组中约20000个蛋白质编码基因可以产生的无数蛋白质版本中

Keren说:“我们想开发一种成像方法,一次捕获更多的它们,这样我们最终就可以对它们全部成像。”

她提供了一个拍照比喻来描述她的使命的本质。“想象一下,你想拍一个房间的快照,但一次只能拍摄三到四个物体,比如桌子、椅子和电视屏幕。当你走到窗户、地毯和台灯前时,你已经拍了几十张照片,然后需要把它们组合起来,才能获得房间的大致图像。”克伦的目标是提供一种在一张照片中拍摄整个房间及其包含的全部物体的方法

与超过100000名依赖Phys.org获取日常见解的订阅者一起探索科学、技术和太空的最新进展。注册我们的免费时事通讯,每天或每周获取重要突破、创新和研究的最新进展

阅读重叠的蛋白质

Keren和她的团队决定依靠所谓的组合方法:通过在每个蛋白质上附着几个荧光标签来标记每个蛋白质,这样每个分子都可以通过创建某种条形码的独特荧光标签组合来识别

组合或条形码的优点是,它们可以大大增加少量颜色标记的分子数量。例如,如果你想对七种不同的分子进行成像,可以只使用三种颜色来标记它们,因为这三种颜色可以有多种可能的组合

随着标签的增加,潜在组合的数量呈指数级增长,解锁了更多的可能性。然而,如果查看多个单独的探针很复杂,那么在查看多个条形码时,问题就变得更加严重。随着条形码数量的增长,它们很快开始重叠,使得无法区分它们

Keren和她的团队认为,人工智能可能能够解决看似棘手的条形码重叠问题。他们假设,人工智能可以通过从组织图像中学习不同蛋白质的表达特性来做到这一点,因为一些蛋白质仅由一种类型的细胞表达,而另一些蛋白质则由不同的细胞表达;有些在细胞表面表达,有些在细胞内部表达;有些无处不在,而另一些则很少见

令人惊讶的是,他们的预感被证明是真的。Keren和她的学生团队与魏茨曼人工智能中心的Shai Bagon博士合作,他们的背景从生物化学到生物信息学再到数学,他们着手设计一种可以同时测量多种蛋白质的实验方法和一种可以梳理包含大量蛋白质条形码的图像的人工智能算法

该团队训练了一个深度神经网络来解决将组合图像分解为单个蛋白质图像的挑战。该网络是在模拟数据上训练的,这些数据是通过汇集世界各地实验室生产的单个蛋白质的大量荧光图像生成的

结果是CombPlex,这是一种人工智能辅助成像方法,可以在单个细胞水平上准确测量组织样本中的多种蛋白质。它可以解压缩人类观众看起来像噩梦般的荧光缠结的图片,将信号分类为单个蛋白质的图像

由于CombPlex与研究和临床中广泛使用的传统荧光显微镜兼容,它有望极大地促进生物医学和医学实验室的组织研究。除了提供更全面的组织图像外,它还可以在一两天内提供蛋白质成像,而传统方法需要数周时间才能获得

Keren说:“我们希望CombPlex有一天能取代常规的病理学方法,因为它能更全面地观察组织,并为临床决策提供更精确的见解。”

理论上,CombPlex使研究人员能够仅使用n个标签捕获多达2n-1个蛋白质。这意味着3个标签可以捕获7种蛋白质;5个标签,31种蛋白质;10个标签,1023种蛋白质,尽管现实生活中的挑战可以减少这些数字。在这项研究中,Keren的团队能够使用条形码测量22种蛋白质,每种条形码包含5个不同的标签

CombPlex的开发得到了魏茨曼研究所翻译研究部门Bina的指导和支持,该部门负责确定具有应用潜力的早期项目。“当我们咨询该领域的专家时,他们都对这项技术非常热情,”Bina的负责人Sharon Fireman博士说