语种识别的关键是从语音片段中提取有用的特征。通过延时神经网络(Time-delayed neural network, TDNN)可以提取包含丰富上下文信息的特征向量,有效提高系统性能。本文提出一种ECAPA(Emphasized channel attention)-TDNN+对比预测编码(Contrastive predictive coding,CPC)模型的多任务学习语种识别网络。ECAPA-TDNN为主干网络,提取语音全局特征,改进的CPC模型为辅助网络,对ECAPA-TDNN提取的帧级特征进行对比预测学习,通过联合损失函数进行优化训练。在东方语种竞赛数据集AP17-OLR的10类语种上进行了实验。实验结果表明,本文提出的网络在1 s,3 s和全长(All)测试集测得的识别准确率相比于基础网络都有明显的提高。
来源出处
基于对比预测编码模型的多任务学习语种识别方法
http://sjcj.nuaa.edu.cn/ch/reader/view_abstract.aspx?file_no=202202003&flag=1
相关内容
发布日期
10/31/2021 - 01:48
发布日期
12/24/2024 - 19:10
发布日期
01/10/2022 - 19:31
发布日期
10/29/2023 - 23:31
发布日期
06/17/2022 - 10:21
发布日期
06/17/2022 - 10:21
发布日期
09/25/2023 - 22:49
发布日期
06/23/2024 - 17:52
发布日期
10/31/2021 - 01:48
发布日期
06/17/2022 - 10:21
发布日期
08/04/2020 - 01:35
发布日期
06/17/2022 - 10:21
发布日期
06/22/2024 - 17:53
发布日期
08/04/2020 - 01:35
发布日期
08/04/2020 - 01:35
发布日期
12/16/2023 - 01:20
发布日期
01/10/2022 - 19:32
发布日期
12/31/2023 - 11:50
发布日期
10/31/2021 - 01:12