- 4 次围观
目的:系统综述自动化神经形态测量工具,并在独立的视神经数据集上独立评估其性能。 设计:系统综述与比较性基准测试研究。 对照:基准测试采用对苯二胺染色的小鼠(n = 85)和大鼠(n = 44)视神经图像,并以人工标注的轴突计数作为真实值。 方法:遵循 PRISMA 指南,通过系统检索 PubMed、Embase 和 Scopus 中截至 2026 年 1 月的文献,识别描述自动化或半自动化神经组织形态测量工具的已发表研究。数据提取涵盖 70 个字段,包括工具功能、成像模态、物种、自动化程度和验证方法。共对 18 个符合条件的工具(8 个深度学习[DL]工具,10 个经典计算机视觉[CV]工具)在小鼠和大鼠两个独立数据集上进行了基准测试。 主要结局指标:采用平均绝对百分比误差(MAPE)、Pearson 相关系数和预测值与真实值比值的中位数评估性能。按单幅图像对工具进行排序,并采用 Friedman 检验结合 Nemenyi 事后分析进行比较。 结果:共有 71 项研究符合纳入标准,时间跨度为 1999 年至 2026 年。深度学习方法占研究总数的 38%(27/71),且其比例从 2017 年之前的 0% 上升至 2020 年之后发表文献中的 55% 以上。轴突计数是最常见的输出指标(73%,52/71),而仅有 35%(25/71)的研究报告了 g-ratio。在纳入基准测试的工具中,Marina(CV,2010)取得了最低的平均 MAPE(32.9%)。前五名工具(MAPE 范围为 32.9%–44.8%)同时包括 CV 和 DL 方法,且经 Friedman-Nemenyi 分析显示其差异无统计学意义(p > 0.05)。不同数据集间的性能差异显著:AxonJ(CV)在大鼠图像上取得第二低的 MAPE(27.7%),但在小鼠图像上表现最差(438.6%)。 结论:没有任何单一工具在两个数据集上均表现出持续优越的性能。经典方法与深度学习方法在轴突计数方面达到了相当的准确性。工具选择应依据目标物种、组织制备方案及所需的形态测量输出而定。本系统综述及独立基准测试研究为视神经研究中的工具选择提供了循证依据。
目的:系统综述自动化神经形态测量工具,并在独立的视神经数据集上独立评估其性能。
设计:系统综述与比较性基准评测研究。
对照:基准评测使用了经对苯二胺染色的小鼠(n = 85)和大鼠(n = 44)视神经图像,并以人工标注的轴突计数作为真实值。
方法:按照 PRISMA 指南,通过对 PubMed、Embase 和 Scopus 截至 2026 年 1 月的系统检索,识别已发表的描述自动化或半自动化神经组织形态测量工具的研究。数据提取涵盖 70 个字段,包括工具功能、成像方式、物种、自动化水平及验证方法。共对 18 个符合条件的工具(8 个深度学习[DL]工具,10 个经典计算机视觉[CV]工具)在小鼠和大鼠两个独立数据集上进行了基准评测。
主要结局指标:性能采用平均绝对百分比误差(MAPE)、Pearson 相关系数以及预测值与真实值比值的中位数进行评估。对各工具按图像逐一排序,并采用 Friedman 检验结合 Nemenyi 事后分析进行比较。
结果:共有 71 项研究符合纳入标准,时间跨度为 1999 年至 2026 年。深度学习方法占 38%(27/71),其比例由 2017 年前的 0% 增长至 2020 年后发表文献中的 55% 以上。轴突计数是最常见的输出指标(73%,52/71),而仅有 35%(25/71)的研究报告了 g-ratio。在纳入基准评测的工具中,Marina(CV,2010)获得了最低的平均 MAPE(32.9%)。前五名工具(MAPE 范围为 32.9%–44.8%)同时包括 CV 和 DL 方法,且在 Friedman-Nemenyi 分析中统计学上无显著差异(p > 0.05)。不同数据集之间的性能差异显著:AxonJ(CV)在大鼠图像上取得第二好的 MAPE(27.7%),但在小鼠图像上表现最差(438.6%)。
结论:没有任何单一工具在两个数据集上均表现出持续优越的性能。经典方法与深度学习方法在轴突计数方面达到了相当的准确性。工具选择应依据目标物种、组织制备方案以及所需的形态测量输出而定。本系统综述与独立基准评测研究为视神经研究中的工具选择提供了循证依据。
📄 原文链接:https://www.biorxiv.org/content/10.64898/2026.06.15.731646v1?rss=1
🏷️ 神经形态测量 系统综述 基准评测 视神经轴突计数 深度学习 计算机视觉