瞳孔反应揭示了价值更新与决策策略在时间上相互区分的特征

root 提交于 周四, 06/18/2026 - 08:47
适应性决策依赖于多巴胺能和去甲肾上腺素能系统,它们分别支持价值学习与探索性决策策略,然而二者的贡献仍然难以通过非侵入性方法加以区分。在本研究中,我们考察了瞳孔动态是否能够为跨感觉模态的基于价值的决策所依赖的计算过程提供可分离的指标,并可能反映不同的神经调质过程。人类参与者完成了一项动态觅食任务,在该任务中,他们基于对价值的估计,在听觉、视觉或视听选项之间进行选择;同时还完成了一项对照任务,在该任务中,选择是被指示的。基于价值任务中的行为可被概率性选择模型较好地刻画,该模型揭示了对奖赏历史的适应性整合,以及探索与利用之间的平衡。瞳孔反应则揭示了决策策略与价值更新在时间上彼此区分的计算特征。反应时与整个决策过程中的持续性瞳孔扩张相关,而被选与未选选项之间的价值差异则选择性地调节了刺激评估阶段及反馈之后的瞳孔反应。这些发现分别与去甲肾上腺素能系统对探索—利用行为调控相关的计算过程,以及多巴胺能系统所介导的价值更新过程相一致。与被指示决策相比,这两种效应在基于价值的决策中均显著更强,表明当选择依赖于已学习的奖赏价值时,这些计算过程的参与程度更高。重要的是,这些效应在很大程度上不依赖于感觉模态,表明这是一种对计算变量的领域一般性编码。总之,这些发现将瞳孔动态确定为一种对适应性决策所依赖的不同计算阶段具有时间敏感性的非侵入性标记,并为将瞳孔测量与关于价值学习和不确定性加工的神经调质理论相联系建立了一个框架。

本网站正在使用一项安全服务来保护自身免受网络攻击。您刚刚执行的操作触发了该安全解决方案。可能导致此次拦截的行为有多种,包括提交某个特定的单词或短语、一条 SQL 命令,或格式错误的数据。

您可以向网站所有者发送电子邮件,告知您被拦截的情况。请在邮件中说明当该页面出现时您正在进行的操作,并附上本页面底部显示的 Cloudflare Ray ID。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.13.732042v1?rss=1

🏷️ 瞳孔反应 价值学习 决策策略 探索—利用 神经调质 适应性决策