阿姆斯特丹大学的科学家发现,人脑能自动理解如何在不同环境中行动——无论是湖中游泳还是小径行走——都无需有意识思考。这些"行动可能性"(或称功能可供性)会激活特定脑区,且与视觉信息无关。相比之下,ChatGPT等人工智能模型仍难以完成此类直觉判断,它们缺乏人类天生理解的物理情境。
当我们看到一张陌生环境的图片——如山路、繁忙街道或河流——我们立刻知道如何在其中移动:步行、骑车、游泳或不再前进。这听起来简单,但你的大脑实际上是如何确定这些动作可能性的呢?
博士生克莱门斯·巴特尼克(Clemens Bartnik)和合作作者团队展示了我们如何通过独特的大脑模式估计可能的动作。该团队由计算神经科学家爱丽丝·格罗恩(Iris Groen)领导,还将这种人类能力与大量AI模型进行了比较,包括ChatGPT。“AI模型在这方面表现较差,仍可以从高效的人类大脑中学习很多,”格罗恩总结道。
在MRI扫描仪中观看图像
使用MRI扫描仪,团队研究了当人们观看各种室内外环境照片时大脑中发生的情况。参与者用按钮指示图片是否邀请他们步行、骑车、驾车、游泳、划船或攀爬。同时,测量了他们的大脑活动。
“我们想知道:当你看到一个场景时,你主要看到那里有什么——如物体或颜色——还是你也会自动看到你能用它做什么,”格罗恩说。“心理学家称之为‘可供性’(affordances)——动作可能性;想象一个你可以攀爬的楼梯,或一个你可以跑过的开阔田野。”
大脑中的独特过程
团队发现,视觉皮层中的某些区域活跃起来,其方式无法用图像中的可见物体解释。“我们看到的是独特的,”格罗恩说。“这些大脑区域不仅代表可见的东西,还代表你能用它做什么。”大脑即使在参与者没有被给予明确动作指令的情况下也是如此。“因此,这些动作可能性是自动处理的,”格罗恩说。“即使你没有意识地思考在环境中能做什么,你的大脑仍然会记录它。”
因此,该研究首次证明了可供性不仅是一个心理学概念,也是我们大脑的一个可测量属性。
AI尚未理解的东西
团队还比较了AI算法——如图像识别模型或GPT-4——在估计你在给定环境中能做什么方面的表现。它们在预测可能动作方面较差。“当专门针对动作识别进行训练时,它们能稍微接近人类判断,但人类大脑模式与模型的内部计算不匹配,”格罗恩解释道。
“即使最好的AI模型也不会给出与人类完全相同的答案,尽管这对我们来说是个如此简单的任务,”格罗恩说。“这表明我们的视觉方式与我们如何与世界互动深度交织。我们将感知连接到我们在物理世界中的经验。AI模型无法做到这点,因为它们只存在于计算机中。”
AI仍可以从人类大脑学习
因此,该研究触及了关于开发可靠高效AI的更大问题。“随着更多部门——从医疗保健到机器人学——使用AI,机器不仅需要识别某物是什么,还需要理解它能做什么变得重要,”格罗恩解释道。“例如,一个需要在灾难区域找到路径的机器人,或一辆能区分自行车道和车道的自动驾驶汽车。”
格罗恩还指出了AI的可持续方面。“当前的AI训练方法使用大量能源,且通常只有大型科技公司能访问。更多关于我们大脑如何工作、人类大脑如何非常快速高效地处理某些信息的知识,可以帮助使AI更智能、更经济、更人性化。”