人工智能能否预测癌症?新模型利用基因组学模拟肿瘤

科学家团队开发出一种卓越的新方法,通过类似天气预报的数字"预测"来模拟细胞随时间变化的行为。该方法将患者基因组学与突破性的纯文本"假设语法"相结合,使研究人员能够模拟细胞在组织内的通讯与进化过程。通过这些数字模拟,科学家可以在虚拟环境中测试癌症如何生长、免疫系统如何响应,甚至能预测治疗方法在个体患者身上可能产生的效果。

马里兰大学医学院(UMSOM)基因组科学研究所(IGS)的研究人员共同领导了这项研究,该研究于7月25日在线发表在《细胞》(Cell) 期刊上。这是一个为期多年、多实验室合作的项目,处于软件开发的交叉领域,并在实验台研究与临床团队科学研究人员之间建立了重要合作。这项研究最终可能促成计算机程序的开发,通过创建患者的"数字孪生体"来帮助确定癌症患者的最佳治疗方案。

"尽管标准生物医学研究在利用基因组学技术表征细胞生态系统方面取得了不可估量的进展,但结果仍然是时间上的单一快照——而非揭示像癌症这样的疾病如何从细胞间的通讯中产生,"马里兰大学医学院基因组科学研究所(IGS)博士后研究员、该研究的共同第一作者珍妮特·约翰逊(Jeanette Johnson)博士表示。"癌症受免疫系统控制或驱动,而免疫系统是高度个体化的;这种复杂性使得难以从人类癌症数据预测到特定患者。"

这项研究的独特之处在于使用了一种平实的"假设语法",它以通用语言作为生物系统与计算模型之间的桥梁,模拟细胞在组织中的行为。

印第安纳大学智能系统工程教授保罗·麦克林(Paul Macklin)博士领导的研究团队开发了这种用于描述细胞行为的语法。该语法使科学家能够使用简单的英语句子构建多细胞生物系统的数字化表示,并使团队能够为癌症等复杂疾病开发计算模型。

"这一新'语法'不仅实现了生物学与代码之间的沟通,还促进了不同学科科学家之间的交流,使他们在研究中能够利用这种建模范式,"IGS科学家、马里兰大学医学院药理学与生理学助理教授、与约翰逊博士共同担任通讯作者的丹尼尔·伯格曼(Daniel Bergman)博士说。

伯格曼博士及其在IGS的同事随后将这种语法与来自真实患者样本的基因组数据相结合,利用空间转录组学等技术研究乳腺癌和胰腺癌。

 

在乳腺癌研究中,IGS团队模拟了一种效应:免疫系统无法遏制肿瘤细胞生长,反而促进了肿瘤侵袭和扩散。他们将这一计算建模框架应用于模拟一项真实的胰腺癌免疫治疗临床试验。

利用来自未经治疗的胰腺癌组织样本的基因组数据,该模型预测每个虚拟"患者"对免疫治疗的反应各不相同——这凸显了细胞生态系统对精准肿瘤学的重要性。例如,胰腺癌难以治疗的部分原因是其周围常被一种称为成纤维细胞的非癌细胞的致密结构所包围。该团队使用新型空间基因组学技术进一步证明了成纤维细胞与肿瘤细胞的通讯方式。该程序使科学家能够追踪来自真实患者组织的胰腺肿瘤生长、进展至侵袭的过程。

"作为一名免疫学研究者,这些模型令我如此兴奋的原因是,它们可以利用实验室和人类基因组数据进行信息输入、初始化和构建,"约翰逊博士说。"免疫细胞非常神奇,它们遵循的行为规则可以被编程到这些模型中。因此,举例来说,我们可以将数据视为人类免疫系统活动的快照,而这个框架为我们提供了一个'沙盒',可以自由探究关于其随时间变化的假设,而无需额外成本或给患者带来风险。"

"自从我从马里兰大学学院园分校的天气预报研究转向计算领域后,我一直相信我们可以将相同的原理应用于生物系统,以创建癌症预测模型。令我震惊的是,我们尚不了解的生物学规则竟如此之多,"IGS主任、格林鲍姆综合癌症中心定量科学副主任、马里兰大学医学院医学与流行病学教授、该研究的通讯作者埃尔娜·J·费尔蒂格(Elana J. Fertig)博士表示。"将这种方法应用于基因组学技术,为我们提供了一个虚拟细胞实验室,在其中我们可以进行实验,以在计算机模拟中完全验证细胞规则的潜在影响。"

费尔蒂格博士称这项研究是"团队科学的织锦",其计算模型还得到了约翰斯·霍普金斯大学和俄勒冈健康科学大学临床合作者的额外验证。该项目由美国国家癌症研究基金会资助。

新语法是开源的,以便所有科学家都能受益。"通过向科学界提供这一工具,我们正在为标准化此类模型并使其获得广泛接受开辟道路,"伯格曼博士说。为证明其普适性,约翰斯·霍普金斯大学医学院(JHSOM)神经科学与神经病学特科维茨家族新星教授吉纳维芙·斯坦-奥布赖恩(Genevieve Stein-O'Brien)博士领导研究人员将该方法应用于神经科学实例,程序成功模拟了大脑发育过程中的分层形成。

"凭借IGS的这项工作,我们拥有了生物研究的新框架,因为研究人员现在可以创建其实验台实验和临床试验的计算机模拟,甚至开始预测疗法对患者的影响,"马里兰大学巴尔的摩分校医学事务副校长、约翰·Z与秋子·K·鲍尔斯杰出教授兼医学院院长马克·T·格拉德温(Mark T. Gladwin)医学博士表示。"这对实现癌症及其他领域数字孪生和虚拟临床试验具有重要应用价值。我们期待未来将该癌症计算建模工作延伸至临床。"

该研究的资深作者团队包括印第安纳大学信息学、计算与工程学院本科教育副院长、智能系统工程教授保罗·麦克林博士,约翰斯·霍普金斯大学布隆伯格神经科学助理教授、单细胞培训与分析中心(STAC)助理主任吉纳维芙·斯坦-奥布赖恩,以及费尔蒂格博士。他们正通过资助本研究的美国国家癌症研究所(NCI)癌症研究信息技术联盟,持续致力于推广该软件,并扩展其与基因组数据的整合以实现自动模型构建。该研究的额外基准测试及软件在乳腺癌和胰腺癌中的应用,获得了多项NCI资助、杰恩·科斯基纳斯·泰德·乔瓦尼斯基金会、美国国家癌症研究基金会、马里兰州香烟赔偿基金项目以及勒斯特加滕基金会的支持。