用于模拟书面语言的人工智能可用于预测人们生活中的事件。DTU、哥本哈根大学、国际电联和美国东北大学的一项研究项目表明,如果使用大量有关人们生活的数据并训练所谓的“变压器模型”,该模型(如 ChatGPT)将用于处理语言,他们可以系统地组织数据并预测一个人一生中会发生什么,甚至估计死亡时间。
在《自然计算科学》杂志上发表的一篇新的科学文章《利用生命事件序列预测人类生活》中,研究人员在一个名为 life2vec 的模型中分析了 600 万丹麦人的健康数据和对劳动力市场的依恋程度。在模型经过初始阶段的训练后,即学习数据中的模式后,它已被证明优于其他先进的神经网络(参见事实框)并以高精度预测诸如性格和死亡时间等结果。
“我们使用该模型来解决一个基本问题:我们可以在多大程度上根据过去的条件和事件来预测未来的事件?从科学角度来说,让我们兴奋的并不是预测本身,而是数据的各个方面这使得模型能够提供如此精确的答案。”DTU 教授、本文的第一作者 Sune Lehmann 说道。
死亡时间的预测
Life2vec 的预测是对一些常见问题的回答,例如:“四年内死亡”?当研究人员分析模型的反应时,结果与社会科学领域的现有发现一致;例如,在所有条件相同的情况下,处于领导地位或高收入的人更有可能生存,而男性、技术熟练或患有精神疾病的人则与更高的死亡风险相关。Life2vec 将数据编码在一个大型向量系统中,这是一种组织不同数据的数学结构。该模型决定将出生时间、就学时间、教育程度、工资、住房和健康数据放在哪里。
“令人兴奋的是,将人类生活视为一长串事件,类似于语言中的句子由一系列单词组成。这通常是人工智能中使用 Transformer 模型的任务类型,但在我们的实验中我们用它们来分析所谓的生命序列,即人类生活中发生的事件,”Sune Lehmann 说。
提出道德问题
文章背后的研究人员指出,life2vec 模型存在伦理问题,例如保护敏感数据、隐私以及数据中偏见的作用。在使用该模型之前,必须更深入地了解这些挑战,例如评估个人感染疾病或其他可预防的生活事件的风险。
“该模型为政治讨论和解决问题开辟了重要的积极和消极观点。如今,用于预测生活事件和人类行为的类似技术已经在科技公司内部使用,例如,跟踪我们在社交网络上的行为,极其准确地描述我们,并“利用这些资料来预测我们的行为并影响我们。这种讨论需要成为民主对话的一部分,以便我们考虑技术将把我们带向何方,以及这是否是我们想要的发展,”Sune Lehmann 说。
研究人员表示,下一步将是整合其他类型的信息,例如文本和图像或有关我们社会关系的信息。这种数据的使用开启了社会科学和健康科学之间的全新互动。
研究项目
“利用生命事件序列预测人类生活”的研究项目基于劳动力市场数据以及国家患者登记处 (LPR) 和丹麦统计局的数据。该数据集包括全部 600 万丹麦人,包含收入、工资、津贴、工作类型、行业、社会福利等信息。健康数据集包括医疗保健专业人员或医院的就诊记录、诊断、患者类型和紧急程度。该数据集涵盖 2008 年至 2020 年,但在多项分析中,研究人员重点关注 2008 年至 2016 年期间以及有年龄限制的个人子集。
变压器型号
Transformer 模型是一种人工智能、深度学习数据架构,用于学习语言和其他任务。可以训练模型来理解和生成语言。Transformer 模型的设计比以前的模型更快、更高效,通常用于在大型数据集上训练大型语言模型。
神经网络
神经网络是一种受人类和动物的大脑和神经系统启发的计算机模型。有许多不同类型的神经网络(例如变压器模型)。与大脑一样,神经网络也是由人工神经元组成的。这些神经元相互连接并可以相互发送信号。每个神经元接收来自其他神经元的输入,然后计算传递给其他神经元的输出。神经网络可以通过大量数据的训练来学习解决任务。神经网络依靠训练数据来学习并随着时间的推移提高其准确性。但是,一旦这些学习算法经过精确调整,它们就会成为计算机科学和人工智能领域的强大工具,使我们能够高速对数据进行分类和分组。最著名的神经网络之一是谷歌的搜索算法。
来源:
Materials provided by Technical University of Denmark. Note: Content may be edited for style and length.
引用:
2024-01-23
2024-01-23
2024-01-23
2024-01-23
2024-01-23