- 3 次围观
类 Hebb 学习已被实验反复证实,然而,计算模型通常需要非局部信号,例如反向传播的误差,才能解决复杂的认知任务。近期的皮层电子显微镜数据提出了一种模型:突触会根据其处于大状态还是小状态而遵循不同的可塑性规则。大型突触通常包含脊器,这是一种影响突触动力学并可改变突触可塑性规则的钙储库。在此,我们检验了这样一类网络的计算结果:其突触会根据自身强度切换可塑性规则。我们设计了一种循环神经网络(RNN),其中突触在两种学习规则之间切换:弱突触采用类 Hebb 规则,强突触采用信用分配规则(反向传播,BP)。我们发现,尽管使用信用分配的突触更少,我们的可塑性切换循环神经网络(psRNN)比仅使用 BP 的 RNN 能够在更少的试次中学会认知任务(例如工作记忆)。这一优势源于三种机制:BP 对多个参数配置进行采样以获得更好的梯度估计,Hebb 可塑性形成了与任务相关的动态初始化,而切换机制则防止 Hebb 突触增长进入不利的参数区域。不同规则之间的相互作用还产生了更低秩、更加前馈化的循环结构,从而提供了可检验的连接组学预测,并为协调大脑中观察到的局部学习规则与计算模型中使用的非局部规则提供了一个框架。
类 Hebb 学习已被反复通过实验证实,然而,计算模型通常需要非局部信号(如反向传播的误差信号)才能解决复杂的认知任务。近期关于皮层的电子显微镜数据提出了一种模型:突触会根据其处于较大状态还是较小状态而遵循不同的可塑性规则。大型突触通常包含脊器,这是一种影响突触动力学并能够改变突触可塑性规则的钙储库。在本文中,我们检验了这样一类网络的计算结果:其通过突触依据自身强度切换可塑性规则来进行计算。我们设计了一种循环神经网络(RNN),其中突触在两种学习规则之间切换:弱突触采用类 Hebb 规则,强突触采用信用分配规则(反向传播,BP)。我们发现,尽管使用信用分配的突触更少,我们的可塑性切换循环神经网络(psRNN)在学习认知任务(例如工作记忆)时,比仅使用 BP 的 RNN 需要更少的试次。这一优势由三种机制支撑:BP 对多个参数配置进行采样以获得更好的梯度估计;Hebb 可塑性构建了一个与任务相关的动态初始化;切换机制则防止 Hebb 突触增长进入不利的参数区域。两种规则之间的相互作用还产生了更低秩、更加前馈化的循环结构,从而提供了可检验的连接组学预测,并为协调脑中观察到的局部学习规则与计算模型中使用的非局部规则提供了一个框架。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.10.731456v1?rss=1
🏷️ 突触可塑性 Hebb学习 反向传播 循环神经网络 工作记忆 信用分配
来源出处