一种轻量级全频带语音增强网络模型

root 提交于 周五, 06/17/2022 - 10:21
基于深度神经网络的全频带语音增强系统面临着计算资源需求高以及语音在各频段分布不平衡的困难。本文提出了一种轻量级全频带网络模型。该模型在双路径卷积循环网络模型的基础上,利用可学习的频谱压缩映射对高频段频谱信息进行有效压缩,同时利用多头注意力机制对频域的全局信息进行建模。实验结果表明本文模型只需0.89×106的参数即可实现有效的全频带语音增强,验证了本文模型的有效性。