计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2014年
6期
1694-1698
,共5页
袁桦%蔡猛%赵军红%张卫强%刘加
袁樺%蔡猛%趙軍紅%張衛彊%劉加
원화%채맹%조군홍%장위강%류가
发音错误检测%Tandem特征%发音规则%深度神经网络(DNN)%多层神经感知(MLP)
髮音錯誤檢測%Tandem特徵%髮音規則%深度神經網絡(DNN)%多層神經感知(MLP)
발음착오검측%Tandem특정%발음규칙%심도신경망락(DNN)%다층신경감지(MLP)
mispronunciation detection%Tandem feature%phonological rule%Deep Neural Network (DNN)%Multi-Layer Perception (MLP)
针对发音错误检测中标注的发音数据资源有限的情况,提出在Tandem系统框架下利用其他数据来提高特征的区分性.以中国人的英语发音为研究对象,选取了相对容易获取的无校正发音数据、母语普通话和母语英语作为辅助数据,实验结果表明,这几种数据都能够有效地提高系统性能,其中无校正数据表现出最好的性能.同时,比较了不同的扩展帧长,以多层神经感知(MLP)和深度神经网络(DNN)作为典型的浅层和深层神经网络,以及Tandem特征的不同结构对系统性能的影响.最后,多数据流融合的策略用于进一步提高系统性能,基于DNN的无校正发音数据流和母语英语数据流合并的Tandem特征取得了最好的性能,与基线系统相比,识别正确率提高了7.96%,错误类型诊断正确率提高了14.71%.
針對髮音錯誤檢測中標註的髮音數據資源有限的情況,提齣在Tandem繫統框架下利用其他數據來提高特徵的區分性.以中國人的英語髮音為研究對象,選取瞭相對容易穫取的無校正髮音數據、母語普通話和母語英語作為輔助數據,實驗結果錶明,這幾種數據都能夠有效地提高繫統性能,其中無校正數據錶現齣最好的性能.同時,比較瞭不同的擴展幀長,以多層神經感知(MLP)和深度神經網絡(DNN)作為典型的淺層和深層神經網絡,以及Tandem特徵的不同結構對繫統性能的影響.最後,多數據流融閤的策略用于進一步提高繫統性能,基于DNN的無校正髮音數據流和母語英語數據流閤併的Tandem特徵取得瞭最好的性能,與基線繫統相比,識彆正確率提高瞭7.96%,錯誤類型診斷正確率提高瞭14.71%.
침대발음착오검측중표주적발음수거자원유한적정황,제출재Tandem계통광가하이용기타수거래제고특정적구분성.이중국인적영어발음위연구대상,선취료상대용역획취적무교정발음수거、모어보통화화모어영어작위보조수거,실험결과표명,저궤충수거도능구유효지제고계통성능,기중무교정수거표현출최호적성능.동시,비교료불동적확전정장,이다층신경감지(MLP)화심도신경망락(DNN)작위전형적천층화심층신경망락,이급Tandem특정적불동결구대계통성능적영향.최후,다수거류융합적책략용우진일보제고계통성능,기우DNN적무교정발음수거류화모어영어수거류합병적Tandem특정취득료최호적성능,여기선계통상비,식별정학솔제고료7.96%,착오류형진단정학솔제고료14.71%.