这使我们能够通过将日常任务(例如外出喝咖啡)分解为步骤来完成:离开办公楼、导航到咖啡店,到达后获取咖啡。该策略帮助我们轻松处理障碍。例如,如果电梯坏了,我们可以在不改变其他步骤的情况下调整离开大楼的方式。
尽管有大量行为证据表明人类擅长处理这些复杂任务,但设计能够精确描述我们解决问题所使用的计算策略的实验场景一直很困难。
在一项新研究中,麻省理工学院的研究人员成功建模了人们如何部署不同的决策策略来解决复杂任务——在本例中,是预测一个被隐藏的球在迷宫中如何行进。人类大脑无法完美执行此任务,因为不可能同时追踪所有可能的轨迹,但研究人员发现,人们可以通过灵活采用两种被称为分层推理和反事实推理的策略,取得相当不错的成绩。
研究人员还能够确定人们在何种情况下选择每种策略。
"人类的能力在于将迷宫分解为若干子部分,然后使用相对简单的算法解决每一步。实际上,当我们没有解决复杂问题的方法时,我们会通过使用更简单的启发式方法来完成任务,"大脑与认知科学教授、麻省理工学院麦戈文脑研究所成员、霍华德·休斯医学研究所研究员、该研究的资深作者梅尔达德·贾扎耶里 (Mehrdad Jazayeri) 说。
论文的主要作者是博士'24马赫迪·拉马丹(Mahdi Ramadan)和研究生唐诚(Cheng Tang),该论文今日发表于《自然·人类行为》(Nature Human Behavior)。博士'25尼古拉斯·沃特斯(Nicholas Watters)也是合著者。
理性策略
当人类执行有明确正确答案的简单任务(例如对物体进行分类)时,表现得非常好。当任务变得更复杂时,例如计划去你最喜欢的咖啡馆,可能就不再有一个明显优越的答案了。而且,在每个步骤中,都可能出现许多问题。在这些情况下,人类非常善于找出能够完成任务的解决方案,即使它可能不是最优解。
这些解决方案通常涉及问题解决的捷径或启发式方法。人类常用的两个主要启发式方法是分层推理和反事实推理。分层推理是将问题分解为多个层次的过程,从一般性开始,走向具体性。反事实推理涉及想象如果你做出不同选择会发生什么。虽然这些策略广为人知,但科学家们对大脑如何在特定情况下决定使用哪一种策略知之甚少。
"这确实是认知科学中的一个重大问题:我们如何以次优方式解决问题——通过想出聪明的启发式方法,并将它们链接起来,最终让我们越来越接近直到解决问题?" 贾扎耶里说。
为了克服这一点,贾扎耶里和他的同事们设计了一项任务,它的复杂性刚好需要使用这些策略,但又足够简单,可以测量其结果和涉及的计算。
该任务要求参与者预测一个球在迷宫中移动时通过四条可能轨迹的路径。一旦球进入迷宫,人们就无法看到它走的是哪条路。在迷宫的两个岔路口,当球到达该点时,他们会听到一个声音提示。预测球的路径是人类无法完美准确完成的任务。
"它需要你在脑海中同时进行四个并行模拟,而人类无法做到这一点。这类似于同时进行四场对话," 贾扎耶里说。"这项任务让我们能够利用人类使用的这套算法,因为你根本无法以最优方式解决它。"
研究人员招募了约150名人类志愿者参与研究。在每个受试者开始球追踪任务前,研究人员评估了他们估算几百毫秒时间间隔的准确性(大约相当于球在迷宫的一条臂上行进所需的时间长度)。
对于每个参与者,研究人员创建了计算模型,这些模型可以预测该参与者(基于他们的计时技能)在使用并行模拟、单独使用分层推理、单独使用反事实推理或组合使用两种推理策略时会出现的错误模式。
研究人员将受试者的表现与模型的预测进行了比较,发现对于每个受试者,他们的表现最接近使用分层推理但有时会切换到反事实推理的模型。
这表明,人们没有追踪球可能采取的所有路径,而是将任务分解。首先,他们选择认为球在第一个岔路口转弯的方向(左或右),并继续追踪球前往下一个转弯点。如果他们听到的下一个声音的时间与他们选择的路径不符,他们就会回头修正他们的第一个预测——但只是偶尔这样做。
切换回另一边(代表转向反事实推理)需要人们回顾他们听到的音调的记忆。然而,事实证明这些记忆并不总是可靠的,研究人员发现人们是否选择回头取决于他们认为自己的记忆有多好。
"人们会在反事实推理有帮助的程度上依赖它," 贾扎耶里说。"反事实推理导致巨大性能损失的人会避免使用它。但如果你是一个真正擅长从近期记忆中检索信息的人,你可能会回到另一边。"
人类局限性
为了进一步验证他们的结果,研究人员创建了一个机器学习神经网络并训练它来完成该任务。在此任务上训练的机器学习模型每次都会准确追踪球的路径并做出正确预测,除非研究人员对其性能施加限制。
当研究人员添加与人类面临的类似的认知限制时,他们发现模型改变了其策略。当他们消除模型追踪所有可能轨迹的能力时,它开始像人类一样采用分层和反事实策略。如果研究人员降低模型的记忆回忆能力,它就只有在认为自己的回忆足够好以得到正确答案时才会切换到分层推理——正如人类所做的那样。
"我们发现,当我们将从人类行为中发现的那些计算限制强加给网络时,网络会模仿人类的行为," 贾扎耶里说。"这真正说明,人类是在其必须运行的限制下理性行事的。"
通过略微改变编程到模型中的记忆损伤程度,研究人员还观察到策略切换似乎是逐渐发生的,而不是在一个明显的临界点发生的迹象。他们现在正在进行进一步研究,试图确定当这些策略转变发生时大脑中发生了什么。
该研究由丽莎·K·杨ICoN奖学金、麦戈文研究所之友学生奖学金、美国国家科学基金会研究生研究奖学金、西蒙斯基金会、霍华德·休斯医学研究所和麦戈文研究所资助。
Story Source:
Materialsprovided byMassachusetts Institute of Technology.Note: Content may be edited for style and length.
Journal Reference:
Mahdi Ramadan, Cheng Tang, Nicholas Watters, Mehrdad Jazayeri.Computational basis of hierarchical and counterfactual information processing.Nature Human Behaviour, 2025; DOI:10.1038/s41562-025-02232-3
2025-06-20
2025-06-20
2025-06-20
2025-06-20