大语言模型(LLMs)是能够处理、解释和生成人类语言的人工智能(AI)系统。例如,ChatGPT生成式人工智能正是基于此类模型。LLMs能够回答问题并解决复杂问题。但它们也能建议具有情感智能的行为吗?
这些结果为人工智能在曾被认为专属于人类的领域(如教育、辅导或冲突管理)中的应用铺平了道路。
充满情感的情境
为探究这一问题,伯尔尼大学心理学研究所和日内瓦大学瑞士情感科学中心(CISA)的研究团队对六种大语言模型(ChatGPT-4、ChatGPT-01、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku和DeepSeek V3)进行了情感智能测试。伯尔尼大学心理学研究所人格心理学、差异心理学与评估部门讲师、首席研究员兼本研究第一作者Katja Schlegel表示:"我们选择了研究和企业环境中常用的五项测试。这些测试通过精心设计的情绪化场景,评估模型理解、调节和管理情绪的能力。"
例如:迈克尔的同事窃取了他的创意并获得了不应得的赞赏。迈克尔最有效的应对方式是什么?
a) 与涉事同事争论
b) 向主管汇报情况
c) 默默怨恨同事
d) 伺机窃取对方创意
在此情境中,选项b)被认为是最合适的应对方式。
同时,研究人员对真人参与者进行了相同的五项测试。参与研究的日内瓦大学瑞士情感科学中心高级科学家Marcello Mortillaro解释道:"最终,大语言模型获得了显著更高的分数——正确率达82%,而人类仅为56%。这表明这些AI不仅理解情绪,还掌握了情感智能行为的本质。"
创纪录速度生成新测试
第二阶段,研究人员要求ChatGPT-4创建包含新情境的情感智能测试题。超过400名参与者参与了这些自动生成的测试。Katja Schlegel说明:"这些测试被证明与耗时数年开发的原始测试具有同等的可靠性、清晰度和真实性。"Marcello Mortillaro补充道:"这表明大语言模型不仅能从现有选项中找出最佳答案,还能生成适应特定情境的新场景。这进一步印证了诸如ChatGPT等大语言模型具备情感知识并能进行情绪推理的观点。"
这些结果为人工智能在曾被认为专属于人类的领域(如教育、辅导或冲突管理)中的应用铺平了道路,前提是由专家使用和监督。
Story Source:
Materialsprovided byUniversité de Genève.Note: Content may be edited for style and length.
Journal Reference:
Katja Schlegel, Nils R. Sommer, Marcello Mortillaro.Large language models are proficient in solving and creating emotional intelligence tests.Communications Psychology, 2025; 3 (1) DOI:10.1038/s44271-025-00258-x
2025-07-01
2025-07-01
2025-07-01
2025-07-01
2025-07-01