语种识别的关键是从语音片段中提取有用的特征。通过延时神经网络(Time-delayed neural network, TDNN)可以提取包含丰富上下文信息的特征向量,有效提高系统性能。本文提出一种ECAPA(Emphasized channel attention)-TDNN+对比预测编码(Contrastive predictive coding,CPC)模型的多任务学习语种识别网络。ECAPA-TDNN为主干网络,提取语音全局特征,改进的CPC模型为辅助网络,对ECAPA-TDNN提取的帧级特征进行对比预测学习,通过联合损失函数进行优化训练。在东方语种竞赛数据集AP17-OLR的10类语种上进行了实验。实验结果表明,本文提出的网络在1 s,3 s和全长(All)测试集测得的识别准确率相比于基础网络都有明显的提高。
来源出处
基于对比预测编码模型的多任务学习语种识别方法
http://sjcj.nuaa.edu.cn/ch/reader/view_abstract.aspx?file_no=202202003&flag=1
相关内容
发布日期
12/12/2023 - 01:18
发布日期
01/21/2024 - 12:12
发布日期
06/17/2022 - 10:21
发布日期
06/17/2022 - 10:21
发布日期
01/10/2022 - 19:31
发布日期
01/22/2024 - 01:44
发布日期
06/17/2022 - 10:21
发布日期
08/23/2024 - 19:21
发布日期
06/17/2022 - 10:21
发布日期
08/18/2024 - 19:19
发布日期
08/04/2020 - 01:35
发布日期
06/17/2022 - 10:21
发布日期
08/04/2020 - 01:35
发布日期
06/17/2022 - 10:21
发布日期
09/10/2023 - 22:37
发布日期
10/31/2021 - 01:12
发布日期
10/31/2021 - 01:48
发布日期
06/17/2022 - 10:21
发布日期
10/12/2023 - 23:10
发布日期
08/04/2020 - 01:35