计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2015年
1期
257-261
,共5页
语音识别%声效%发音特征%多模型框架%孤立词
語音識彆%聲效%髮音特徵%多模型框架%孤立詞
어음식별%성효%발음특정%다모형광가%고립사
speech recognition%Vocal Effort (VE)%articulatory feature%multi-model framework%isolated-word
针对声效(VE)相关的语音识别鲁棒性问题,提出了基于多模型框架的语音识别算法.首先,分析了不同声效模式下语音信号的声学特性以及声效变化对语音识别精度的影响;然后,提出了基于高斯混合模型(GMM)的声效模式检测方法;最后,根据声效检测的结果,训练专门的声学模型用于耳语音识别,而将发音特征与传统的谱特征一起用于其余4种声效模式的语音识别.基于孤立词识别的实验结果显示,采用所提方法后语音识别准确率有了明显的提高:与基线系统相比,所提方法5种声效的平均字错误率降低了26.69%;与声学模型混合语料训练方法相比,平均字错误率降低了14.51%;与最大似然线性回归(MLLR)自适应方法相比,平均字错误率降低了15.30%.实验结果表明:与传统谱特征相比发音特征对于声效变化更具鲁棒性,而多模型框架是解决声效相关的语音识别鲁棒性问题的有效方法.
針對聲效(VE)相關的語音識彆魯棒性問題,提齣瞭基于多模型框架的語音識彆算法.首先,分析瞭不同聲效模式下語音信號的聲學特性以及聲效變化對語音識彆精度的影響;然後,提齣瞭基于高斯混閤模型(GMM)的聲效模式檢測方法;最後,根據聲效檢測的結果,訓練專門的聲學模型用于耳語音識彆,而將髮音特徵與傳統的譜特徵一起用于其餘4種聲效模式的語音識彆.基于孤立詞識彆的實驗結果顯示,採用所提方法後語音識彆準確率有瞭明顯的提高:與基線繫統相比,所提方法5種聲效的平均字錯誤率降低瞭26.69%;與聲學模型混閤語料訓練方法相比,平均字錯誤率降低瞭14.51%;與最大似然線性迴歸(MLLR)自適應方法相比,平均字錯誤率降低瞭15.30%.實驗結果錶明:與傳統譜特徵相比髮音特徵對于聲效變化更具魯棒性,而多模型框架是解決聲效相關的語音識彆魯棒性問題的有效方法.
침대성효(VE)상관적어음식별로봉성문제,제출료기우다모형광가적어음식별산법.수선,분석료불동성효모식하어음신호적성학특성이급성효변화대어음식별정도적영향;연후,제출료기우고사혼합모형(GMM)적성효모식검측방법;최후,근거성효검측적결과,훈련전문적성학모형용우이어음식별,이장발음특정여전통적보특정일기용우기여4충성효모식적어음식별.기우고립사식별적실험결과현시,채용소제방법후어음식별준학솔유료명현적제고:여기선계통상비,소제방법5충성효적평균자착오솔강저료26.69%;여성학모형혼합어료훈련방법상비,평균자착오솔강저료14.51%;여최대사연선성회귀(MLLR)자괄응방법상비,평균자착오솔강저료15.30%.실험결과표명:여전통보특정상비발음특정대우성효변화경구로봉성,이다모형광가시해결성효상관적어음식별로봉성문제적유효방법.