一种基于稀疏优化和Nesterov动量策略的模型剪枝算法

root 提交于 周五, 06/14/2024 - 17:47
随着深度学习快速发展,模型的参数量和计算复杂度爆炸式增长,在移动终端上部署面临挑战,模型剪枝成为深度学习模型落地应用的关键。目前,基于正则化的剪枝方法通常采用L2正则化并结合基于数量级的重要性标准,是一种经验性的方法,缺乏理论依据,精度难以保证。受Proximal梯度方法求解稀疏优化问题的启发,本文提出一种能够在深度神经网络上直接产生稀疏解的Prox-NAG优化方法,并设计了与之配套的迭代剪枝算法。该方法基于L1正则化,利用Nesterov动量求解优化问题,克服了原有正则化剪枝方法对L2正则化和数量级标准的依赖,是稀疏优化从传统机器学习向深度学习的自然推广。在CIFAR10数据集上对ResNet系列模型进行剪枝实验,实验结果证明Prox-NAG剪枝算法较原有剪枝算法性能有所提升。

相关内容

发布日期 01/10/2022 - 19:31
发布日期 10/31/2021 - 01:16
发布日期 11/09/2024 - 19:46
发布日期 11/17/2024 - 19:48
发布日期 07/23/2023 - 21:46
发布日期 03/11/2025 - 20:51
发布日期 06/17/2022 - 10:21
发布日期 10/14/2023 - 23:10
发布日期 06/05/2024 - 17:45