目标导向因果学习过程中认知价值的感觉运动编码

root 提交于 周四, 06/04/2026 - 22:47
理解目标导向因果学习背后的神经与计算机制,是认知神经科学和人工智能领域中的一项核心挑战。这一认知功能依赖于在奖励最大化与信息寻求之间取得平衡。尽管在刻画奖励驱动学习的神经基础方面已经取得了显著进展,但大脑是否以及如何表征内在信息价值,并通过皮层—皮层相互作用加以传播,仍不清楚。在此,我们采用一种新的行为范式,将信息寻求与奖励最大化在目标导向因果学习过程中加以区分;在该范式中,被试在没有外在激励的情况下估计动作—结果之间的偶联关系。贝叶斯计算建模表明,尽管随机探索主导了行为,期望信息增益(EIG)仍能解释部分实验场次中相当比例的探索性选择。通过结合脑磁图与对高伽马活动的信息论分析,我们表明,EIG在动作执行时编码于左侧感觉运动皮层,具体定位于背侧前运动皮层和初级运动皮层,并被传播至初级躯体感觉皮层。这些发现与主动推断的预测一致,即EIG构成探索性动作选择的一项关键计算驱动力。然而,这些结果对“认知性价值评估仅招募前额叶奖赏回路”的观点提出了挑战;相反,它们支持一种具身化解释,即在第一人称干预性因果学习中,前运动与感觉运动系统介导了内在价值评估。

理解目标导向因果学习所依赖的神经与计算机制,是认知神经科学和人工智能领域中的核心挑战。这一认知功能取决于在奖励最大化与信息寻求之间取得平衡。尽管在表征奖励驱动学习的神经基础方面已经取得了实质性进展,但内在信息价值是否以及如何在大脑中被表征,并通过皮层—皮层相互作用进行传播,仍不清楚。在此,我们采用一种新的行为学范式,将信息寻求与奖励最大化在目标导向因果学习过程中加以区分;在该范式中,参与者在没有外在激励的情况下估计动作—结果关联。贝叶斯计算建模表明,尽管随机探索主导了行为,但在部分实验场次中,期望信息增益(EIG)能够解释相当比例的探索性选择。通过结合脑磁图与对高伽马活动的信息论分析,我们表明,EIG在动作执行时刻编码于左侧感觉运动皮层,具体定位于背侧前运动皮层和初级运动皮层,并被广播至初级躯体感觉皮层。这些发现与主动推断的预测一致,即EIG构成探索性动作选择的关键计算驱动力。然而,这些结果对“认知性价值评估仅招募前额叶奖励回路”的观点提出了挑战,转而支持一种具身化解释:在第一人称干预性因果学习中,前运动与感觉运动系统介导了内在价值评估。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.03.729806v1?rss=1

🏷️ 认知价值编码 目标导向因果学习 期望信息增益 感觉运动皮层 脑磁图 主动推断