该系统名为CytoDiffusion,依赖于生成式人工智能,即与DALL-E等图像生成器相同的技术,以详细分析血细胞形态。它不仅关注明显的模式,还研究显微镜下细胞外观的细微差异。
超越模式识别
许多现有的医学人工智能工具被训练用于将图像归入预定义的类别。相比之下,CytoDiffusion背后的团队证明,他们的方法能够识别所有正常的血细胞形态,并能可靠地标记出可能预示疾病的罕见或异常细胞。这项工作由剑桥大学、伦敦大学学院和伦敦玛丽女王大学的研究人员领导,研究结果发表在《自然·机器智能》上。
识别血细胞大小、形状和结构的微小差异,是诊断许多血液疾病的核心。然而,学习掌握这项技能可能需要数年经验,即使是训练有素的医生在会诊复杂病例时也可能意见不一。
"我们体内有许多不同类型的血细胞,它们具有不同的特性和作用,"该研究的第一作者、剑桥大学应用数学和理论物理系的西蒙·德尔塔达尔说。"例如,白细胞专门负责对抗感染。但知道显微镜下异常或病变的血细胞是什么样子,是诊断许多疾病的重要环节。"
处理血液分析的规模
一份标准的血涂片可能包含数千个独立的细胞,远超出人力逐一检查的范围。"人类无法查看涂片中的所有细胞——这根本不可能,"德尔塔达尔说。"我们的模型可以自动化这个过程,对常规病例进行分诊,并突出任何异常情况供人工审核。"
临床医生对此挑战深有体会。"我作为一名初级血液科医生面临的临床挑战是,一天工作结束后,我需要分析大量血涂片,"共同资深作者、伦敦玛丽女王大学的苏特什·西瓦帕拉拉特纳姆博士说。"当我在深夜分析它们时,我确信人工智能会比我做得更好。"
利用前所未有的数据集进行训练
为了构建CytoDiffusion,研究人员使用剑桥大学阿登布鲁克医院收集的超过50万张血涂片图像对其进行训练。该数据集被描述为同类中规模最大的,包含了常见的血细胞类型、罕见样本以及经常使自动化系统混淆的特征。
该人工智能不仅学习如何将细胞归入固定类别,而是对整个血细胞形态谱系进行建模。这使得它更能适应不同医院、显微镜和染色技术之间的差异,同时也提高了其检测罕见或异常细胞的能力。
以更高置信度检测白血病
在测试中,CytoDiffusion识别与白血病相关的异常细胞的灵敏度远高于现有系统。即使使用少得多的样本进行训练,它的表现也媲美或优于当前的主流模型,并且能够量化其自身预测的置信度。
"当我们测试其准确性时,该系统略优于人类,"德尔塔达尔说。"但它真正突出之处在于知道何时不确定。我们的模型绝不会在声称确定的情况下出错,但人类有时会犯这样的错误。"
共同资深作者、剑桥大学应用数学和理论物理系的迈克尔·罗伯茨教授表示,该系统是参照医学人工智能在现实世界中所面临的挑战进行评估的。"我们在许多现实世界人工智能面临的挑战中评估了我们的方法,例如从未见过的图像、不同机器捕获的图像以及标签的不确定程度,"他说。"这个框架提供了模型性能的多维度视图,我们相信这对研究人员是有益的。"
当人工智能图像蒙骗人类专家时
研究团队还发现,CytoDiffusion可以生成与真实血细胞无法区分的合成图像。在一项涉及十位经验丰富的血液学专家的"图灵测试"中,专家们区分真实图像和人工智能生成图像的准确率并不比随机猜测更高。
"这真的让我感到惊讶,"德尔塔达尔说。"这些人整天盯着血细胞看,就连他们也分辨不出来。"
向全球研究界开放数据
作为该项目的一部分,研究人员正在发布他们描述的世界上最大的公开外周血涂片图像集,总计超过50万个样本。
"通过开放这一资源,我们希望能使全球研究人员有能力构建和测试新的人工智能模型,促进高质量医学数据的普及,最终为改善患者护理做出贡献,"德尔塔达尔说。
支持而非替代临床医生
尽管结果显著,研究人员强调,CytoDiffusion并非旨在替代训练有素的医生。相反,它的设计目的是通过快速标记可疑病例和自动处理常规样本来协助临床医生。
"医疗保健人工智能的真正价值不在于以更低的成本近似人类专业知识,而在于实现比专家或简单统计模型所能达到的更强的诊断、预后和处方能力,"共同资深作者、伦敦大学学院的帕拉什克夫·纳切夫教授说。"我们的工作表明,生成式人工智能将是这一使命的核心,它不仅将改变临床支持系统的保真度,还将改变其对自身知识局限性的洞察。这种'元认知'意识——知道自己不知道什么——对临床决策至关重要,而在这里我们显示机器可能比我们更擅长于此。"
团队指出,需要进行更多研究来提高系统的速度,并在更多样化的患者群体中验证其性能,以确保准确性和公平性。
该研究获得了三一挑战赛、威康信托基金会、英国心脏基金会、剑桥大学医院 NHS信托基金、巴茨健康 NHS信托基金、NIHR剑桥生物医学研究中心、NIHR UCLH生物医学研究中心以及 NHS血液与移植的支持。这项工作由BloodCounts!联盟内的成像工作组完成,该联盟旨在利用人工智能改善全球血液诊断。西蒙·德尔塔达尔是剑桥大学露西·卡文迪什学院的成员。
Story Source:
Materials provided byUniversity of Cambridge.Note: Content may be edited for style and length.
Journal Reference:
Simon Deltadahl, Julian Gilbey, Christine Van Laer, Nancy Boeckx, Mathie P. G. Leers, Tanya Freeman, Laura Aiken, Timothy Farren, Matthew Smith, Mohamad Zeina, Stephen MacDonald, Daniel Gleghorn, Martijn Schut, Folkert Asselbergs, Sujoy Kar, Sophie Williams, Mickey Koh, Yvonne Henskens, Norbert de Wit, Umberto D’Alessandro, Bubacarr Bah, Ousman Secka, Rajeev Gupta, Sara Trompeter, Christine van Laer, Gordon A. Awandare, Kwabena Sarpong, Lucas Amenga-Etego, Willem H. Ouwehand, James H. F. Rudd, James HF Rudd, Concetta Piazzese, Joseph Taylor, Nicholas Gleadall, Carola-Bibiane Schönlieb, Suthesh Sivapalaratnam, Michael Roberts, Parashkev Nachev.Deep generative classification of blood cell morphology.Nature Machine Intelligence, 2025; 7 (11): 1791 DOI:10.1038/s42256-025-01122-7
2026-01-15
2026-01-15
2026-01-15
2026-01-15
2026-01-15