果蝇多巴胺能神经元中的多时间尺度学习信号

root 提交于 周四, 06/11/2026 - 02:47
学习通常需要对隐藏的任务结构进行推断,包括那些能够预测结果的特征。在哺乳动物中,中脑多巴胺神经元的预测误差信号传导被认为是学习的核心,但这些神经元如何反映学习的进程与稳定性仍不清楚。我们利用果蝇,在厌恶性条件作用过程中以逐试次分辨率监测钙活动,发现PPM3多巴胺能神经元表现出典型的预测误差反应:其活动从无条件刺激(US)转移到条件刺激(CS);当预期的US被省略时,其活动受到抑制;而当US超出预期时,其活动则增强。引人注目的是,同一类神经元还在跨试次尺度上表现出较慢的状态样动力学,包括随着学习而出现的强直性活动转换,这种转换追踪了习得行为的获得,以及当预期被违反时短暂受扰动的扰动相关动力学。通过在CS与US之间插入时间间隔以提高任务要求(即痕迹条件作用),这两类反应均被推迟到后续试次出现,并伴随着行为习得相应的延迟。此外,多巴胺能活动还产生了一种预期性反应,在该时间间隔期间追踪US预期出现的时间。这些发现表明,单一类型的多巴胺能神经元整合了瞬时预测误差、预期结果的时间信息,以及一种反映学习稳定化的较长时间尺度信号,并由此确立果蝇作为解析在变化任务要求下塑造学习的神经机制之真实有效模型的地位。

学习往往需要对隐藏的任务结构进行推断,包括那些能够预测结果的特征。在哺乳动物中,中脑多巴胺神经元发出的预测误差信号被认为是学习的核心,但这些神经元如何反映学习进程及其稳定性仍不清楚。我们利用果蝇,在厌恶性条件作用过程中以逐试次分辨率监测钙活动,发现PPM3多巴胺能神经元表现出典型的预测误差反应:其活动由无条件刺激(US)转移至条件刺激(CS);当预期的US被省略时,其活动受到抑制;而当US超出预期时,其活动增强。值得注意的是,同一类神经元还在跨试次尺度上表现出较慢的状态样动力学,包括随学习出现的强直性活动转换,这种转换追踪了习得行为的获得,以及当预期被违反时短暂受扰动的相关动力学。通过在CS与US之间插入时间间隔以提高任务要求(即痕迹条件作用),这两类反应都被延迟到后续试次出现,同时伴随着行为获得的相应延迟。此外,多巴胺能活动还发展出一种预期性反应,在这一时间间隔期间追踪US的预期出现时刻。这些发现表明,单一类型的多巴胺能神经元整合了瞬时预测误差、预期结果的时间信息以及一种反映学习稳定化的较长时间尺度信号,并由此确立果蝇作为解析在不断变化的任务要求下塑造学习的神经机制之真正模型系统的地位。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.08.729969v1?rss=1

🏷️ 果蝇 多巴胺能神经元 预测误差 条件作用 时间尺度学习 钙成像