SpikeCleaner:一种用于自动化尖峰分类后标注神经元单元质量的算法

root 提交于 周三, 06/24/2026 - 14:47
摘要 缺口:自动化尖峰分拣算法已经彻底改变了从细胞外记录中提取神经元活动的方式,但其仍然并不完美。具体而言,对基于噪声的单元的不准确接纳,不仅会使研究人员面对需要大量人工整理的簇——这一过程虽必不可少却极其耗时——还会导致单元选择中显著的主观性。在 Neuropixels 等高密度探针时代,1 小时的数据量即可超过 80 GB,人工整理已不再具有可扩展性;将标准准则自动化能够加快数据整理速度,并确保数据集质量。在此,我们开发了一条半自动整理流程,用于在 Kilosort 自动整理之后对单元质量进行标注。 方法:我们的算法通过结合尖峰发放率、尖峰时序指标(来自自相关图)以及基于波形的生理特征,如峰值幅度、斜率、半高宽和通道间相关性,来标准化对噪声、多单元活动(MUA)和优质单元的标注准则。基于这些特征,簇被赋予标准化标签(good、noise、multi-unit activity),这些标签可直接导入 Phy,在其中作为整理辅助而非绝对分类使用,即支持而不取代专家判断。从启发式角度看,“noise” 单元是指那些不太可能源于神经元的单元;“MUA” 包括具有显著神经贡献(即具有神经元波形)但仍存在某种明确不完美之处、需进一步清理的单元;而“good” 单元则是指未表现出任何明显偏离理想单元标准的单元。通过确保对可接受单元的准确筛选,我们能够支持稳健的下游分析,例如神经解码和神经元身份的纵向追踪。所有指标的阈值均经过选择,以最大程度提高算法输出与 2 位专家人工整理者结果之间的一致性。值得注意的是,用户既可以基于自身判断调整阈值,也可以使用附带工具半自动寻找阈值,以使 SpikeCleaner 更好地针对其自身的专家整理结果进行优化。 结果:为进行基准测试,我们将算法输出与两位专家用户在三组记录中通过 Phy 整理得到的专家标签进行了比较。SpikeCleaner 在单单位分类上相较专家实现了平均 97% 的准确率和 92% 的 F1 分数。在全类别一致性(SU、MUA、Noise)上,其准确率为 97%,F1 分数为 92%;在区分神经元性与非神经元性单元方面,其准确率为 97%,F1 分数为 95%。

Brendon O Watson 的 ORCID 记录

摘要 信息/历史 指标 数据/代码 PDF 预览

摘要

摘要

空白:自动化尖峰分类算法已经彻底改变了从细胞外记录中提取神经元活动的方式,但这些算法仍然并不完美。具体而言,基于噪声的单元被错误接纳,不仅会给研究人员留下需要大量人工整理的簇——这一过程虽属必要,却十分耗时——还会在单元筛选中引入显著的主观性。在 Neuropixels 等高密度探针时代,1 小时的数据量即可超过 80 GB,人工整理已不再具有可扩展性;将标准判据自动化能够加快数据整理并确保数据集质量。在此,我们开发了一条半自动整理流程,用于在 Kilosort 自动分类之后对单元质量进行标注。

方法:我们的算法通过结合尖峰发放率、尖峰时序指标(来自自相关图)以及基于波形的生理特征,如峰值幅度、斜率、半宽和通道间相关性,来标准化对噪声、多单元活动(MUA)和优质单元的标注标准。基于这些特征,簇被赋予标准化标签(good、noise、multi-unit activity),这些标签可直接导入 Phy,在其中作为整理辅助而非绝对分类,起到支持而不替代专家判断的作用。从启发式角度看,“noise” 单元是指那些不太可能来源于神经元的单元;“MUA” 包括具有显著神经贡献(即具有神经元波形)但仍存在某种明显不完美、需进一步清理的单元;而“good” 单元则是不表现出任何明显偏离理想单元标准的单元。通过确保可接受单元的准确筛选,我们能够支持稳健的下游分析,例如神经解码和神经元身份的纵向追踪。所有指标的阈值均通过最大化算法输出与 2 位人工专家整理者结果之间的一致性来确定。值得注意的是,用户既可以依据自身判断调整阈值,也可以使用随附工具,以半自动方式寻找能够基于其自身专家整理结果优化 SpikeCleaner 的阈值。

结果:为了进行基准评估,我们将算法输出与两位专家用户在三段记录中使用 Phy 整理的专家标注进行了比较。SpikeCleaner 在单单位(Single Units)的分类中,相对于专家标注达到了平均 97% 的准确率和 92% 的 F1 分数。在完整类别一致性(SU、MUA、噪声)方面,其准确率为 97%,F1 分数为 92%;在区分神经元与非神经元单元方面,其准确率为 97%,F1 分数为 95%。

竞争利益声明 作者声明不存在竞争利益。

脚注 https://github.com/BrendonWatsonLab/SpikeCleaner

已声明的资助信息 美国国立卫生研究院(NIH) MH107662 MH131592 NS141983 NS139668 MH131527 普利兹克神经精神疾病研究联盟 密歇根大学神经科学学者基金

版权 持有人为作者/资助方,其已授予 bioRxiv 永久展示该预印本的许可。 其依据 CC-BY 4.0 国际许可协议 对外提供。

返回顶部 上一项 下一项 发布于 2026 年 6 月 23 日。 下载 PDF 数据/代码 电子邮件

感谢您有兴趣传播 bioRxiv。 您的电子邮箱 * 您的姓名 * 发送至 * 请输入多个地址,每行一个,或用逗号分隔。 您将要发送以下内容的电子邮件 SpikeCleaner:自动化尖峰分类后单元质量标注算法 邮件主题 (您的姓名)已从 bioRxiv 向您转发了一个页面 邮件正文 (您的姓名)认为您可能希望查看 bioRxiv 网站上的此页面。 您的个人留言 验证码 此问题用于测试您是否为人工访客,并防止自动垃圾信息提交。 分享 SpikeCleaner:自动化尖峰分类后单元质量标注算法 Diksha Zutshi, Daniil Berezhnoi, Anjesh Ghimire, Jeremiah Hartner, David Kim, Brendon O Watson bioRxiv 2026.06.18.733033; doi: https://doi.org/10.64898/2026.06.18.733033

分享本文: 复制 引用工具 SpikeCleaner:自动化尖峰分类后单元质量标注算法 Diksha Zutshi, Daniil Berezhnoi, Anjesh Ghimire, Jeremiah Hartner, David Kim, Brendon O Watson bioRxiv 2026.06.18.733033; doi: https://doi.org/10.64898/2026.06.18.733033


📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.18.733033v1?rss=1

🏷️ 尖峰分拣 神经元单元质量 自动化标注 细胞外记录 Neuropixels 神经数据分析