语音情感识别任务的训练数据和测试数据往往来源于不同的数据库,二者特征空间存在明显差异,导致识别率很低。针对该问题,本文提出新的构图方法表示源和目标数据库之间的拓扑结构,利用图卷积神经网络进行跨语料库的情感识别。针对单一情感特征识别率不高的问题,提出一种新的特征融合方法。首先利用 OpenSMILE提取浅层声学特征,然后利用图卷积神经网络提取深层特征。随着卷积层的不断深入,节点的特征信息被传递给其他节点,使得深层特征包含更明确的节点特征信息和更详细的语义信息,然后将浅层特征和深层特征进行特征融合。采用两组实验进行验证,第1组用eNTERFACE库训练测试Berlin库,识别率为59.4%;第2组用Berlin库训练测试eNTERFACE库,识别率为36.1%。实验结果高于基线系统和文献中最优的研究成果,证明本文提出方法的有效性。
来源出处
基于图卷积深浅特征融合的跨语料库情感识别
http://sjcj.nuaa.edu.cn/ch/reader/view_abstract.aspx?file_no=202301009&flag=1
相关内容
发布日期
06/17/2022 - 10:21
发布日期
06/17/2022 - 10:21
发布日期
09/15/2024 - 19:29
发布日期
06/22/2024 - 17:53
发布日期
06/03/2024 - 17:45
发布日期
06/17/2022 - 10:21
发布日期
03/19/2024 - 09:13
发布日期
10/31/2021 - 01:47
发布日期
06/02/2024 - 17:44
发布日期
01/10/2022 - 19:31
发布日期
10/31/2021 - 01:12
发布日期
10/31/2021 - 01:12
发布日期
01/10/2022 - 19:31
发布日期
08/04/2020 - 01:35
发布日期
03/24/2024 - 09:16
发布日期
10/31/2021 - 01:47
发布日期
01/19/2024 - 12:16
发布日期
01/10/2022 - 19:31
发布日期
01/21/2024 - 12:12
发布日期
06/17/2022 - 10:21