阿姆斯特丹大学的科学家发现,人类大脑能够自动理解如何在各种环境中移动——无论是在湖中游泳还是沿小径行走——这些过程无需意识参与。这些"行为可能性"(或称可供性)会激活特定脑区,且该过程与视觉内容无关。相比之下,像ChatGPT这类人工智能模型仍难以进行此类直觉判断,缺乏人类天然掌握的物理情境理解能力。
当我们看到一幅陌生环境的图片——山路、繁忙的街道或河流——我们立刻就能知道如何在其中移动:行走、骑车、游泳或是止步不前。这听起来简单,但你的大脑究竟如何判断这些行动可能性?
博士生克莱门斯·巴特尼克(Clemens Bartnik)与合作者团队展示了我们如何通过独特的大脑模式估算可能的行动。由计算神经科学家艾里斯·格罗恩(Iris Groen)领导的团队还将人类这种能力与包括ChatGPT在内的大量AI模型进行了比较。格罗恩总结道:"AI模型在这方面的表现较差,仍有诸多需要向高效人脑学习之处。"
核磁共振扫描仪中的图像观察
团队利用核磁共振扫描仪研究了当人们观看各种室内外环境照片时大脑的活动。参与者通过按钮表明图像是否激发他们行走、骑车、驾车、游泳、划船或攀爬的意愿,同时测量其大脑活动。
"我们想知道:当你注视一个场景时,主要看到的是存在的事物——如物体或颜色——还是也会自动看到能对其采取的行动,"格罗恩解释道,"心理学家称后者为'可供性'(affordances)——行动的契机;想象你可攀爬的楼梯,或是能穿越的开阔田野。"
大脑的独特运作机制
团队发现视觉皮层的特定区域会产生无法用图像中可见物体解释的激活。"我们观察到的现象是独特的,"格罗恩指出,"这些脑区不仅呈现可见之物,同时表征可为之举。"即使未向参与者明确下达行动指令,大脑仍会执行此过程。"这表明行动可能性被自动处理,"格罗恩补充道,"即使你未主动思考环境中能做什么,大脑仍会记录这些信息。"
该研究首次证明可供性不仅是心理学概念,更是人脑可测量的特性。
AI尚未理解的领域
团队还对比了AI算法(如图像识别模型或GPT-4)预测特定环境中可行行动的能力。它们在预测可能行动方面表现较差。"经过专门的动作识别训练后,AI模型能部分接近人类判断,但人脑活动模式与模型内部计算并不匹配,"格罗恩阐释道。
"即使最先进的AI模型也无法给出与人类完全一致的答案,尽管这对人类而言极其简单,"格罗恩表示,"这表明我们的视觉方式与和世界的交互深度交织。我们将感知与物理世界的体验相连接,而AI模型因仅存在于计算机中无法实现这一点。"
AI仍可向人脑学习
该研究触及了关于开发可靠高效AI的更宏观命题。"随着医疗到机器人等更多领域应用AI,机器不仅要识别物体属性,还需理解其功能潜力变得至关重要,"格罗恩说明道,"例如需在灾区导航的机器人,或能区分自行车道与车行道的自动驾驶汽车。"
格罗恩同时指出AI的可持续性问题:"当前AI训练方法消耗巨大能量,且往往仅限大型科技公司使用。深入了解大脑运作机制及其快速高效处理特定信息的方式,有助于使AI更智能、更节能、更人性化。"