基于声学模型共享的零资源韩语语音识别|||北京沫之东生物技术有限公司

基于声学模型共享的零资源韩语语音识别

10 次围观

精准的语音识别系统通常使用大量的有标注语音数据训练得到，但现有的开源大规模数据集只包含一些广泛使用的语言，诸多小语种则面临着训练数据不足的问题。声学模型共享方法给出了这个问题的一种解决方法，它利用不同语种间的相似性，可以实现不需要小语种语音数据的语音识别。本文将声学模型共享方法扩展到韩语语音识别上，利用汉语声学模型构建韩语和汉语之间的音素映射关系。在不使用任何韩语语音数据的情况下构建的语音识别系统在Zeroth测试集上的字错误率达到了27.33%。同时本文还测试了不同映射方式之间的差异，结果表明这种共享模型的音素映射应当采用将目标语言词汇映射为源语言音素的方式。

来源出处

基于声学模型共享的零资源韩语语音识别 http://sjcj.nuaa.edu.cn/ch/reader/view_abstract.aspx?file_no=202301007&flag=1