研究人员将AI与10万人在创造力方面进行了对比测试

一项涵盖超过10万人与当今最先进AI系统对比的大规模新研究得出了一个令人惊讶的结果:生成式AI现在在某些创造力测试中能够击败普通人类。GPT-4等模型在测量原创思维和构思能力的任务中表现强劲,有时甚至超越普通人类的表现。但存在明显上限。最具创造力的人类——尤其是前10%的顶尖人群——仍然远远领先于AI,特别是在诗歌和故事创作等更复杂的创造性工作中。

这项发表在《科学报告》(Nature Portfolio)上的研究指出了一个重大转变。生成式人工智能系统现在已达到这样一种水平:在某些创造力指标上,它们可以超越普通人类。与此同时,即使面对最强大的AI模型,最具创造力的人群仍然展现出明显且一贯的优势。

AI达到人类平均创造力水平

研究人员评估了包括ChatGPT、Claude、Gemini在内的几款主流大语言模型,并将其表现与超过10万名人类参与者的结果进行了比较。研究结果揭示了一个清晰的转折点。包括GPT-4在内的一些AI系统,在旨在衡量语言发散性创造力的任务上,超过了人类的平均得分。

"我们的研究表明,一些基于大语言模型的AI系统,现在可以在定义明确的任务上超越人类的平均创造力,"卡里姆·杰尔比教授解释道。"这一结果可能令人惊讶——甚至令人不安——但我们的研究也强调了一个同样重要的观察结果:即使是最优秀的AI系统,仍然无法达到最具创造力的人类所达到的水平。"

该研究的共同第一作者、博士后研究员安托万·贝勒马尔-佩潘(蒙特利尔大学)和博士生弗朗索瓦·莱斯皮纳斯(康考迪亚大学)的进一步分析揭示了一个引人注目的模式。虽然一些AI模型现在表现优于普通人,但创造力的顶峰仍然牢牢掌握在人类手中。

事实上,当研究人员检视最具创造力的那半数参与者时,他们的平均得分超过了所有接受测试的AI模型。在最具创造力的前10%的人群中,这个差距甚至更大。

"我们开发了一个严谨的框架,使我们能够使用相同的工具比较人类和AI的创造力,该框架基于来自超过10万名参与者的数据,并与多伦多大学的杰伊·奥尔森合作完成,"卡里姆·杰尔比教授说,他同时也是米拉研究所的副教授。

科学家如何衡量人类和AI的创造力

为了公平地评估人类和机器的创造力,研究团队使用了多种方法。主要工具是发散联想任务,这是一种广泛使用的心理测试,用于衡量发散性创造力,即根据单一提示生成多样化和原创想法的能力。

由研究合著者杰伊·奥尔森创建的发散联想任务要求参与者(无论是人类还是AI)列出十个在意义上尽可能不相关的词语。一个具有高度创造性的回答示例包括这样的词语:"星系, 叉子, 自由, 藻类, 口琴, 量子, 怀旧, 天鹅绒, 飓风, 光合作用"。

在此任务上的表现与写作、创意生成和创造性问题解决中使用的其他成熟创造力测试的结果密切相关。尽管该任务基于语言,但它远远超出了词汇本身。它涉及了在多个领域创造性思维中所涉及的更广泛的认知过程。发散联想任务还具有实际优势,因为它只需两到四分钟即可完成,并且公众可以在线访问。

从词语列表到真正的创意写作

研究人员随后探究了AI在这个简单词语联想任务上的成功,是否能扩展到更复杂、更现实的创意活动中。为了测试这一点,他们比较了AI系统和人类参与者在创意写作挑战中的表现,例如创作俳句(一种简短的三行诗形式)、撰写电影情节梗概以及创作短篇故事。

 

结果遵循了一个熟悉的模式。虽然AI系统有时超过了普通人类的表现,但最有技巧的人类创作者始终能产出更有力、更原创的作品。

AI的创造力可以调整吗?

这些发现提出了另一个重要问题:AI的创造力是固定的,还是可以被塑造?研究表明,AI的创造力可以通过改变技术设置来调整,特别是模型的"温度"参数。这个参数控制着生成结果的 predictability(可预测性)或探索性。

在较低的温度设置下,AI产生更安全、更常规的输出。在较高的温度下,响应变得更加多样化、更不可预测且更具探索性,使系统能够超越熟悉的思路。

研究人员还发现,创造力受到指令编写方式的强烈影响。例如,鼓励模型使用词源学思考词语起源和结构的提示词,会导致更意想不到的联想和更高的创造力得分。这些结果强调,AI的创造力在很大程度上依赖于人类的指导,使得交互和提示成为创造性过程的核心部分。

AI会取代人类创作者吗?

对于人工智能可能取代创意专业人士的担忧,这项研究提供了一个平衡的视角。虽然AI系统现在在某些任务上可以达到或超过人类的平均创造力,但它们仍然有明显的局限性,并且依赖于人类的指导。

"尽管AI现在可以在某些测试中达到人类水平的创造力,但我们需要超越这种误导性的竞争感,"卡里姆·杰尔比教授说。"生成式AI首先已经成为服务于人类创造力的一个极其强大的工具:它不会取代创作者,而是将深刻改变他们想象、探索和创造的方式——对于那些选择使用它的人来说。"

这些发现并未预示创意职业生涯的终结,而是预示着一个AI作为创意助手的未来。通过扩展思路和开辟新的探索路径,AI可能有助于增强人类的想象力,而不是取代它。

"通过直接比较人类和机器的能力,像我们这样的研究促使我们重新思考创造力的含义,"卡里姆·杰尔比教授总结道。

关于这项研究

这篇题为"Divergent creativity in humans and large language models"的论文于2026年1月21日发表在《科学报告》上。该研究汇集了来自蒙特利尔大学、康考迪亚大学、多伦多大学密西沙加分校、米拉研究所(魁北克人工智能研究所)和Google DeepMind的科学家。

卡里姆·杰尔比教授领导了这项研究,安托万·贝勒马尔-佩潘(蒙特利尔大学)和弗朗索瓦·莱斯皮纳斯(康考迪亚大学)担任共同第一作者。研究团队还包括米拉研究所的创始人、现代人工智能系统(如ChatGPT)背后的技术——深度学习领域的先驱约书亚·本吉奥。