基于对比预测编码模型的多任务学习语种识别方法

root 提交于 周一, 01/10/2022 - 19:32
语种识别的关键是从语音片段中提取有用的特征。通过延时神经网络(Time-delayed neural network, TDNN)可以提取包含丰富上下文信息的特征向量,有效提高系统性能。本文提出一种ECAPA(Emphasized channel attention)-TDNN+对比预测编码(Contrastive predictive coding,CPC)模型的多任务学习语种识别网络。ECAPA-TDNN为主干网络,提取语音全局特征,改进的CPC模型为辅助网络,对ECAPA-TDNN提取的帧级特征进行对比预测学习,通过联合损失函数进行优化训练。在东方语种竞赛数据集AP17-OLR的10类语种上进行了实验。实验结果表明,本文提出的网络在1 s,3 s和全长(All)测试集测得的识别准确率相比于基础网络都有明显的提高。

相关内容

发布日期 01/10/2022 - 19:31
发布日期 08/23/2024 - 19:21
发布日期 06/17/2022 - 10:21
发布日期 06/17/2022 - 10:21
发布日期 08/04/2020 - 01:35
发布日期 06/17/2022 - 10:21
发布日期 10/12/2023 - 23:10