基于图卷积深浅特征融合的跨语料库情感识别

root 提交于 周五, 06/17/2022 - 10:21
语音情感识别任务的训练数据和测试数据往往来源于不同的数据库,二者特征空间存在明显差异,导致识别率很低。针对该问题,本文提出新的构图方法表示源和目标数据库之间的拓扑结构,利用图卷积神经网络进行跨语料库的情感识别。针对单一情感特征识别率不高的问题,提出一种新的特征融合方法。首先利用 OpenSMILE提取浅层声学特征,然后利用图卷积神经网络提取深层特征。随着卷积层的不断深入,节点的特征信息被传递给其他节点,使得深层特征包含更明确的节点特征信息和更详细的语义信息,然后将浅层特征和深层特征进行特征融合。采用两组实验进行验证,第1组用eNTERFACE库训练测试Berlin库,识别率为59.4%;第2组用Berlin库训练测试eNTERFACE库,识别率为36.1%。实验结果高于基线系统和文献中最优的研究成果,证明本文提出方法的有效性。

相关内容

发布日期 06/17/2022 - 10:21
发布日期 09/15/2024 - 19:29
发布日期 06/03/2024 - 17:45
发布日期 06/17/2022 - 10:21
发布日期 06/02/2024 - 17:44
发布日期 10/31/2021 - 01:12
发布日期 01/10/2022 - 19:31
发布日期 01/10/2022 - 19:31