智能计算机与应用
智能計算機與應用
지능계산궤여응용
Intelligent Computer and Applications
2015年
5期
15-17,21
,共4页
王朝松%韩纪庆%郑铁然
王朝鬆%韓紀慶%鄭鐵然
왕조송%한기경%정철연
深度学习%检测%AdaBoost%最小分类错误
深度學習%檢測%AdaBoost%最小分類錯誤
심도학습%검측%AdaBoost%최소분류착오
Deep Learning%Spoken Term Detection%AdaBoost%Minimum Classification Error
关键词检测是从连续语音流中检测预先定义的给定词的技术,是语音识别领域的一个重要应用。目前的关键词检测研究中,主流的方法是基于连续语音识别器的先识别后检测的两阶段方法,语音识别器的准确率对关键词检测有很大影响。本文首先在识别阶段引入深度学习技术来改善关键词检测算法的性能。进而针对识别阶段和检测阶段缺乏紧密联系,耦合度不够的问题,研究了侧重关键词的深度神经网络声学建模技术,利用非均匀的最小分类错误准则来调整深度神经网络声学建模中的参数,并利用AdaBoost算法来动态调整声学建模中的关键词权重。结果表明,利用非均匀最小分类错误准则来调整深度神经网络参数进行优化的声学模型,可以提高关键词检测的性能。
關鍵詞檢測是從連續語音流中檢測預先定義的給定詞的技術,是語音識彆領域的一箇重要應用。目前的關鍵詞檢測研究中,主流的方法是基于連續語音識彆器的先識彆後檢測的兩階段方法,語音識彆器的準確率對關鍵詞檢測有很大影響。本文首先在識彆階段引入深度學習技術來改善關鍵詞檢測算法的性能。進而針對識彆階段和檢測階段缺乏緊密聯繫,耦閤度不夠的問題,研究瞭側重關鍵詞的深度神經網絡聲學建模技術,利用非均勻的最小分類錯誤準則來調整深度神經網絡聲學建模中的參數,併利用AdaBoost算法來動態調整聲學建模中的關鍵詞權重。結果錶明,利用非均勻最小分類錯誤準則來調整深度神經網絡參數進行優化的聲學模型,可以提高關鍵詞檢測的性能。
관건사검측시종련속어음류중검측예선정의적급정사적기술,시어음식별영역적일개중요응용。목전적관건사검측연구중,주류적방법시기우련속어음식별기적선식별후검측적량계단방법,어음식별기적준학솔대관건사검측유흔대영향。본문수선재식별계단인입심도학습기술래개선관건사검측산법적성능。진이침대식별계단화검측계단결핍긴밀련계,우합도불구적문제,연구료측중관건사적심도신경망락성학건모기술,이용비균균적최소분류착오준칙래조정심도신경망락성학건모중적삼수,병이용AdaBoost산법래동태조정성학건모중적관건사권중。결과표명,이용비균균최소분류착오준칙래조정심도신경망락삼수진행우화적성학모형,가이제고관건사검측적성능。
Spoken term detection ( STD) is a task to automatically detect a set of keywords in continuous speech, which is an important field of speech recognition.Current study is based on two-stage approach i.e.recognition and detection.The accuracy of speech recognition has a significant impact on keyword detection.Firstly, this paper uses deep leaning tech-niques to improve performance during the first stage.As the two stages lack of close contact, the paper studies using non-uniform misclassification error ( MCE) criteria to adjust the parameters in deep neural network based acoustic modeling. Further the paper uses the adaptive boosting ( AdaBoost) strategy to adjust keywords’ weight dynamically.It shows that non-uniform MCE can improve the performance of STD.