阿姆斯特丹大学的科学家发现,人类大脑能自动理解如何在不同环境中移动——无论是湖中游泳还是沿路行走——整个过程无需意识参与。这些"动作可能性"(action possibilities)或称"可供性",会独立于视觉信息激活特定脑区。相比之下,ChatGPT等人工智能模型仍难以进行此类直觉判断,缺乏人类与生俱来的物理环境理解能力。
当我们看到一幅陌生环境的图片——无论是山间小径、繁忙街道还是河流——我们瞬间就知道如何在其中移动:步行、骑车、游泳或是止步不前。这听起来简单,但你的大脑究竟如何识别这些行动可能性?
博士生克莱门斯·巴特尼克(Clemens Bartnik)与合著团队揭示了独特的脑活动模式如何支撑我们对潜在行动的判断。这支由计算神经科学家艾里斯·格伦(Iris Groen)领导的团队,还将人类这项能力与包括ChatGPT在内的多种AI模型进行了对比。"事实证明,AI模型在此类任务上表现较差,仍需向高效的人类大脑学习借鉴,"格伦总结道。
MRI扫描仪中的图像观察
研究团队利用磁共振成像(MRI)扫描仪,探测了人们观看各类室内外环境图片时的大脑活动。参与者通过按钮指出图像诱发的行动意向:步行、骑车、驾驶、游泳、划船或攀爬,同时其脑活动被精确记录。
"我们试图探究:当你注视场景时,是主要感知存在物——如物体或色彩——还是同时自动识别其功能属性,"格伦解释道,"心理学家将后者称为'可供性(affordances)'——即行动可能性;设想你可攀爬的阶梯,或能奔跑的开阔田野。"
大脑的独特处理机制
团队发现视觉皮层的特定区域激活模式,无法用图像中的可见物体解释。"我们观测到的现象具有独特性,"格伦指出,"这些脑区不仅表征所见之物,同时编码其功能属性。"即便未收到明确行动指令,大脑仍自发执行该处理过程。"这表明行动可能性是被自动处理的,"格伦强调,"即使你未主动思考环境中的可行行动,大脑仍会将其记录在案。"
该研究首次证明:可供性不仅是心理学概念,更是大脑中可测量的实体特性。
AI尚未理解的领域
团队还对比了AI算法(如图像识别模型或GPT-4)预测环境行动可能性的能力。结果发现AI预测准确度显著低于人类。"专门进行动作识别训练的模型可部分接近人类判断,但其内部计算模式与人类脑活动并不匹配,"格伦阐释道。
"即使最优异的AI模型也无法给出与人类完全一致的答案——尽管这对我们而言轻而易举,"格伦表示,"这表明人类的视觉方式与交互世界的模式深度交织。我们将感知与物理世界的经验相连接,而AI模型仅存在于计算机中,无法实现这种联结。"
AI仍需向人脑学习
该研究触及了发展可靠高效AI的核心命题。"随着医疗到机器人等领域广泛应用AI,机器不仅需识别物体本质,更要理解其功能属性,"格伦解释道,"例如灾难现场导航的机器人,或能区分自行车道与车行道的自动驾驶汽车。"
格伦同时指出AI的可持续性问题:"当前AI训练方法能耗巨大,且多被大型科技公司垄断。深入探究人脑工作机制——尤其是其快速高效处理特定信息的方式——将助力AI向更智能、更节能、更人性化的方向进化。"