基于临界频带的交互性双支路单通道语音增强模型|||北京沫之东生物技术有限公司

基于临界频带的交互性双支路单通道语音增强模型

3 次围观

针对目前主流的双支路单通道语音增强方法只关注全频带信息而忽略子频带信息这一问题，设计了一种基于人耳临界频带的交互性双支路模型。主要做法为，在复数谱支路上实施模拟人耳临界频带的划分方法对信号进行分频带处理，提取子带信息；在幅度补偿支路上直接对信号的全频带进行处理，提取全频带信息。复数谱支路负责初步恢复干净语音的幅度和相位，同时，该支路上学到的子带中间特征会被特定的模块传递给幅度补偿支路进行补偿；幅度补偿支路上的输出会对复数谱支路上输出的幅度做进一步的补偿，达到恢复干净语音频谱的目的。实验结果表明，提出的模型在恢复语音质量和可懂度方面优于其他先进的单通道语音增强模型。

来源出处

基于临界频带的交互性双支路单通道语音增强模型 http://sjcj.nuaa.edu.cn/sjcjycl/article/abstract/202302003