CAJ | 학술논문

针对声效(VE)相关的语音识别鲁棒性问题,提出了基于多模型框架的语音识别算法.首先,分析了不同声效模式下语音信号的声学特性以及声效变化对语音识别精度的影响;然后,提出了基于高斯混合模型(GMM)的声效模式检测方法;最后,根据声效检测的结果,训练专门的声学模型用于耳语音识别,而将发音特征与传统的谱特征一起用于其余4种声效模式的语音识别.基于孤立词识别的实验结果显示,采用所提方法后语音识别准确率有了明显的提高:与基线系统相比,所提方法5种声效的平均字错误率降低了26.69％;与声学模型混合语料训练方法相比,平均字错误率降低了14.51％;与最大似然线性回归(MLLR)自适应方法相比,平均字错误率降低了15.30％.实验结果表明:与传统谱特征相比发音特征对于声效变化更具鲁棒性,而多模型框架是解决声效相关的语音识别鲁棒性问题的有效方法.
침대성효(VE)상관적어음식별로봉성문제,제출료기우다모형광가적어음식별산법.수선,분석료불동성효모식하어음신호적성학특성이급성효변화대어음식별정도적영향;연후,제출료기우고사혼합모형(GMM)적성효모식검측방법;최후,근거성효검측적결과,훈련전문적성학모형용우이어음식별,이장발음특정여전통적보특정일기용우기여4충성효모식적어음식별.기우고립사식별적실험결과현시,채용소제방법후어음식별준학솔유료명현적제고:여기선계통상비,소제방법5충성효적평균자착오솔강저료26.69％;여성학모형혼합어료훈련방법상비,평균자착오솔강저료14.51％;여최대사연선성회귀(MLLR)자괄응방법상비,평균자착오솔강저료15.30％.실험결과표명:여전통보특정상비발음특정대우성효변화경구로봉성,이다모형광가시해결성효상관적어음식별로봉성문제적유효방법.