研究人员测试了生成式人工智能在处理复杂医疗数据集方面能否与人类专家相媲美。在某些案例中,AI的表现堪比甚至超越了花费数月构建预测模型的研究团队。通过根据精准指令生成可用的分析代码,这些系统大幅缩减了健康数据的处理时间。这项研究预示着未来人工智能将助力科学家更快实现从数据到发现的转化。
为了直接比较性能,研究人员将相同的任务分配给不同的团队。一些团队完全依赖人类专业知识,而另一些团队则让科学家与人工智能工具合作。其挑战是利用来自1000多名孕妇的数据预测早产。
即使是由加州大学旧金山分校硕士生Reuben Sarwal和高中生Victor Tarca组成的一对初级研究人员,也在人工智能的支持下成功开发出预测模型。该系统在几分钟内生成了可运行的计算机代码——这通常需要经验丰富的程序员花费几个小时甚至几天的时间。
这种优势来自于人工智能能够基于简短但高度具体的提示编写分析代码。并非每个系统都表现良好。8个人工智能聊天机器人中只有4个生成了可用的代码。尽管如此,那些成功的系统并不需要大型专家团队来指导。
正因为这种速度,这些初级研究人员能够在几个月内完成他们的实验、验证他们的发现,并将结果提交给期刊。
"这些人工智能工具可以缓解数据科学中最大的瓶颈之一:构建我们的分析流程,"医学博士Marina Sirota说,她是儿科教授,加州大学旧金山分校Bakar计算健康科学研究所(BCHSI)临时主任,也是加州大学旧金山分校March of Dimes早产研究中心的首席研究员。"对于现在就需要帮助的患者来说,这种加速来得正是时候。"
Sirota是这项研究的共同高级作者,该研究于2月17日发表在《细胞报告医学》上。
早产研究为何重要
加快数据分析可以改进早产的诊断工具——早产是新生儿死亡的主要原因,也是导致儿童长期运动和认知障碍的重要因素。在美国,每天大约有1000名婴儿早产。
研究人员仍未完全了解早产的成因。为了调查可能的风险因素,Sirota的团队汇编了来自约1200名孕妇的微生物组数据,这些孕妇的妊娠结果在九项独立研究中被追踪记录。
"这种工作只有通过开放数据共享,汇集众多女性的经历和众多研究人员的专业知识才能实现,"医学博士Tomiko T. Oskotsky说,她是March of Dimes早产数据存储库的联合主任,加州大学旧金山分校BCHSI的副教授,也是该论文的合著者。
然而,分析如此庞大而复杂的数据集被证明具有挑战性。为了解决这个问题,研究人员转向了一个名为DREAM(逆向工程评估与方法对话)的全球性众包竞赛。
Sirota共同领导了三个DREAM妊娠挑战之一,专门关注阴道微生物组数据。全球有100多个团队参与,开发旨在检测与早产相关模式的机器学习模型。大多数团队在三个月的竞赛期内完成了工作。然而,整合发现并发表却花了近两年时间。
在妊娠和微生物组数据上测试人工智能
出于对生成式人工智能能否缩短这一时间线的好奇,Sirota的团队与密歇根州底特律韦恩州立大学分子医学与遗传学中心教授、共同高级作者Adi L. Tarca博士领导的研究人员合作。Tarca领导了另外两个DREAM挑战,重点是改进估计妊娠阶段的方法。
研究人员共同指导八个人工智能系统,使用来自三个DREAM挑战的相同数据集独立生成算法,无需直接的人类编码。
这些人工智能聊天机器人接收了精心编写的自然语言指令。与ChatGPT非常相似,这些系统通过详细的提示进行引导,旨在引导它们以与原始DREAM参与者相当的方式分析健康数据。
它们的目标与早期的挑战相同。人工智能系统分析阴道微生物组数据以识别早产迹象,并检查血液或胎盘样本以估计胎龄。妊娠 dating几乎总是一个估计值,但它决定了随着妊娠进展女性接受的护理类型。当估计不准确时,为分娩做准备就变得更加困难。
然后,研究人员使用DREAM数据集运行人工智能生成的代码。8个工具中只有4个产生的模型与人类团队的性能相匹配,尽管在某些情况下人工智能模型表现更好。整个生成式人工智能工作——从开始到论文提交——只用了六个月。
科学家们强调,人工智能仍然需要仔细的监督。这些系统可能会产生误导性结果,人类专业知识仍然至关重要。然而,通过快速筛选庞大的健康数据集,生成式人工智能可能使研究人员将更少的时间花在调试代码上,而将更多的时间用于解释结果和提出有意义的科学问题。
"得益于生成式人工智能,数据科学背景有限的研究人员不再总是需要组建广泛的合作团队或花费数小时调试代码,"Tarca说。"他们可以专注于回答正确的生物医学问题。"
作者:加州大学旧金山分校的作者有Reuben Sarwal;Claire Dubin;Sanchita Bhattacharya, MS;以及Atul Butte, MD, PhD。其他作者有Victor Tarca(密歇根州安娜堡市休伦高中);Nikolas Kalavros 和 Gustavo Stolovitzky, PhD(纽约大学);Gaurav Bhatti(韦恩州立大学);以及Roberto Romero, MD, D(Med)Sc(国家儿童健康与人类发展研究所(NICHD))。
资助:这项工作由加州大学旧金山分校March of Dimes早产研究中心和ImmPort资助。本研究中使用的数据部分由NICHD妊娠研究分支支持生成。