冻结连续时间网络中类爬行纤维的在线读出适应重现了力场适应及后效应

root 提交于 周二, 06/16/2026 - 10:47
基于液体神经网络及相关连续时间模型(如 LTC 和 CfC)的机器人运动控制,通常通过时间反向传播进行离线训练,并且缺乏在被控对象动力学发生变化时进行在线重校准的显式机制。我们探讨如下问题:一个冻结的 CfC 核心,其液体状态张成固定的连续时间基,是否能够仅通过在爬行纤维样误差信号驱动下适配其线性读出,从而支持类似小脑的在线适应。 在一个具有速度相关旋转力场的二维平面双连杆到达仿真中,我们在最小均方(LMS)规则下,使用反馈误差学习(FEL)信号对读出层进行在线适配,同时保持核心部分不变。仅适配读出层的冻结核心控制器能够重新拉直受旋转力场扰动的到达轨迹,并且在力场移除后产生镜像式后效应——这是内部模型学习的标志——而仅依赖反馈的控制器则不会产生这种现象。 当将循环状态而非投影后的电机输出用作读出基时,这一结果可从稠密 CfC 推广到稀疏的神经回路策略(NCP)连接结构;该方法对力场强度和方向具有鲁棒性;递归最小二乘变体虽然适应更快,但由于其协方差塌缩而去适应缓慢,而协方差重置的安全遗忘规则可以消除这种刚性。在所考察的二维双连杆平面仿真范围内,我们未发现任何需要在测试条件下适配冻结核心的容量上限。因此,在这项仿真研究中,仅适配读出层即可为离线训练的连续时间控制器提供一种具有生物学启发、低成本的在线误差适应层。

基于液体神经网络及相关连续时间模型(如 LTC 和 CfC)的机器人运动控制,通常通过时间反向传播进行离线训练,并且缺乏一种在被控对象动力学发生变化时进行在线重新校准的显式机制。我们探讨这样一个问题:一个冻结的 CfC 核心,其液体状态张成一个固定的连续时间基底,是否能够通过仅在线调整其线性读出,并使用一种类似攀缘纤维的误差信号,来支持小脑风格的在线适应。

在一个具有速度相关旋转力场的二维双连杆到达任务仿真中,我们在最小均方(LMS)规则下,利用反馈误差学习(FEL)信号对读出层进行在线适应,而保持核心部分不变。仅调整读出层的冻结核心控制器能够重新拉直到达轨迹中受旋转力场扰动而弯曲的运动;并且在移除力场后,会产生镜像式后效应——这是内部模型学习的标志性特征——而仅依赖反馈的控制器则不会产生这种现象。

当将稠密 CfC 推广到稀疏的神经电路策略(NCP)连接结构时,只要使用循环状态而非投影后的电机输出作为读出基底,该结果仍然成立;该方法对力场强度和方向具有鲁棒性;递归最小二乘变体虽然适应更快,但由于其协方差塌缩而表现出较慢的去适应,这种刚性可通过一种带协方差重置的安全遗忘规则加以消除。在所考察的二维双连杆平面仿真范围内,我们未发现任何需要在测试条件下对冻结核心进行适应的容量上限。

因此,在这项仿真研究中,仅对读出层进行适应,为经过离线训练的连续时间控制器提供了一种受生物学启发、低成本的在线误差适应层。


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.11.731593v1?rss=1

🏷️ 连续时间网络 CfC模型 在线适应 力场学习 反馈误差学习 小脑启发控制