这使得我们可以通过将诸如外出买咖啡这样的日常任务分解为步骤来完成:走出办公楼,导航至咖啡店,到达后购买咖啡。这种策略帮助我们轻松应对障碍。例如,如果电梯故障,我们可以调整走出大楼的方式,而无需改变其他步骤。
尽管大量行为证据表明了人类处理此类复杂任务的技能,但设计能够精确描述我们用于解决问题的计算策略的实验场景一直很困难。
在一项新研究中,麻省理工学院的研究人员成功建模了人们如何运用不同的决策策略来解决复杂任务——具体任务是在球体被遮挡视线的情况下,预测其通过迷宫的路径。人脑无法完美执行此任务,因为不可能同时追踪所有可能的轨迹。但研究人员发现,人们可以通过灵活采用两种被称为"分层推理"和"反事实推理"的策略来取得相当不错的表现。
研究人员还确定了人们在何种情况下会选择每种策略。
"人类能做到的是将迷宫分解为子部分,然后使用相对简单的算法解决每个步骤。实际上,当我们无法解决复杂问题时,会通过使用更简单的启发法来完成任务。"该研究的资深作者、脑与认知科学教授、麻省理工学院麦戈文脑研究所成员、霍华德·休斯医学研究所研究员Mehrdad Jazayeri解释道。
论文第一作者为Mahdi Ramadan博士('24届)和研究生Cheng Tang。Nicholas Watters博士('25届)也是合著者。该研究发表于今天的Nature Human Behavior期刊。
理性策略
当人类执行具有明确正确答案的简单任务(如物体分类)时,表现极其出色。当任务变得更复杂(如规划前往最喜爱咖啡馆的行程)时,可能不再存在一个明显最优的解决方案,且每个步骤都可能出现意外。在这些情况下,人类非常擅长找到能够完成任务(尽管可能不是最优)的解决方案。
这些解决方案通常涉及问题解决的捷径或启发法。人类常用的两种主要启发法是分层推理和反事实推理。分层推理是将问题分解为多个层次的过程,从总体出发逐步细化。反事实推理则是设想如果做出不同选择会发生什么。尽管这些策略广为人知,但科学家对其大脑如何在特定情境下决定使用哪种策略知之甚少。
"这确实是认知科学中的一个重大问题:我们如何通过设计巧妙的启发法并将其串联起来,以次优方式解决问题,从而逐步逼近解决方案?" Jazayeri提出。
为攻克此难题,Jazayeri及其团队设计了一项任务:它足够复杂以需要这些策略,又足够简单以便测量结果及相关计算过程。
该任务要求参与者预测球体在迷宫中四条可能轨迹的运动路径。球体进入迷宫后,人们无法看见其实际路径。在迷宫的两个岔路口,当球体抵达时会听到声音提示。人类无法完美准确地预测球体路径。
"这需要在脑海中并行模拟四种轨迹,而人类无法做到。这类似于同时进行四场对话," Jazayeri表示,"该任务能让我们探测人类使用的这套算法,因为你根本无法以最优方式解决它。"
研究人员招募约150名志愿者参与研究。每位受试者开始球体追踪任务前,研究人员会评估他们估算数百毫秒(约等于球体在迷宫单臂上移动所需时长)时间跨度的准确性。
针对每位参与者,研究人员建立了计算模型:若他们采用并行模拟、纯分层推理、纯反事实推理或两种推理策略的组合,可基于其计时能力预测该参与者可能出现的错误模式。
将受试者表现与模型预测对比后发现:每位受试者的表现都与采用分层推理但偶尔切换至反事实推理的模型最为吻合。
这表明人们并非追踪球体所有可能路径,而是将任务分解:首先选择认为球体在第一个岔路口的转向(左或右),然后继续追踪球体直至下一个转弯处。若听到的下一个声音提示时间与其选择的路径不符,他们会回溯并修正首次预测——但这仅发生在部分情况下。
切换回另一侧(代表转向反事实推理)需要人们回顾所听到的提示音记忆。然而这些记忆并不可靠,研究人员发现人们是否选择回溯取决于其对自身记忆可靠性的判断。
"人们仅在有益时依赖反事实推理," Jazayeri指出,"若进行反事实推理会导致显著表现损失,人们会避免使用。但如果你非常擅长从近期记忆中提取信息,则可能回溯至另一侧。"
人类局限
为验证结果,研究人员创建了机器学习神经网络并训练其执行该任务。除非人为施加性能限制,否则训练后的模型每次都能准确追踪球体路径并做出正确预测。
当研究人员添加类似人类面临的认知限制后,模型改变了策略:消除其跟踪所有可能轨迹的能力时,它开始像人类一样运用分层和反事实策略;降低其记忆召回能力时,仅当认为召回足以获得正确答案时才会切换至分层推理——这也与人类行为一致。
"我们发现,当对模型施加人类行为中存在的计算约束时,网络会模仿人类行为," Jazayeri总结道,"这确切表明人类是在其必须运作的约束下理性行事的。"
通过微调模型中预设的记忆损伤程度,研究人员还发现策略转换似乎是渐进的而非存在清晰分界点。目前他们正进行深入研究,试图揭示策略转换时大脑的活动机制。
本研究由Lisa K. Yang ICoN奖学金、麦戈文研究所之友学生奖学金、美国国家科学基金会研究生研究奖学金、西蒙斯基金会、霍华德·休斯医学研究所及麦戈文研究所资助。
Story Source:
Materialsprovided byMassachusetts Institute of Technology.Note: Content may be edited for style and length.
Journal Reference:
Mahdi Ramadan, Cheng Tang, Nicholas Watters, Mehrdad Jazayeri.Computational basis of hierarchical and counterfactual information processing.Nature Human Behaviour, 2025; DOI:10.1038/s41562-025-02232-3
2025-06-21
2025-06-21
2025-06-21
2025-06-21