通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 信息科技

传统诊断决策支持系统在疾病诊断方面的表现优于生成式人工智能

本站发布时间:2025-06-22 09:27:23
注:部分名称可能翻译不全,如有问题可联系15163559288@163.com

他们的新研究比较了ChatGPT、Gemini和DXplain在诊断患者病例方面的表现,显示DXplain表现得略好一些,但大型语言模型也表现良好。研究人员设想将DXplain与大型语言模型配对作为最佳前进方向,因为这将改善两个系统并增强它们的临床效力。研究结果发表在《JAMA Network Open》上。

"在人们对大型语言模型充满兴趣的同时,很容易忘记医学中最早成功应用的人工智能系统是像DXplain这样的专家系统,"共同作者、麻省总医院LCS的爱德华·霍夫尔医学博士说。

"这些系统可以增强和扩展临床医生的诊断,回忆起医生在紧急时刻可能忘记的信息,并且不受人类推理中常见缺陷的偏见。现在,我们认为将现有诊断系统的强大解释能力与大型语言模型的语言能力结合起来,将促成更好的自动化诊断决策支持和患者结果,"通讯作者、麻省总医院LCS的米切尔·费尔德曼医学博士说。

研究人员使用涵盖种族、民族、年龄和性别类别的36个患者病例测试了DXplain、ChatGPT和Gemini的诊断能力。对于每个病例,这些系统有机会在有无实验室数据的情况下提出潜在诊断。在有实验室数据的情况下,所有三个系统大多数时候都列出了正确诊断:DXplain为72%,ChatGPT为64%,Gemini为58%。在没有实验室数据的情况下,DXplain在56%的情况下列出了正确诊断,优于ChatGPT(42%)和Gemini(39%),尽管结果在统计上不显著。

研究人员观察到,DDSS和大型语言模型捕捉到了其他系统遗漏的某些疾病,这表明结合这些方法可能有前途。基于这些发现的初步工作表明,大型语言模型可用于从叙述性文本中提取临床发现,然后这些可以被输入到DDSS中——从而协同改善两个系统及其诊断结论。

Story Source:

Materialsprovided byMass General Brigham.Note: Content may be edited for style and length.

Journal Reference:

Mitchell J. Feldman, Edward P. Hoffer, Jared J. Conley, Jaime Chang, Jeanhee A. Chung, Michael C. Jernigan, William T. Lester, Zachary H. Strasser, Henry C. Chueh.Dedicated AI Expert System vs Generative AI With Large Language Model for Clinical Diagnoses.JAMA Network Open, 2025; 8 (5): e2512994 DOI:10.1001/jamanetworkopen.2025.12994

排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

北前院微信公众号