天津大学学报
天津大學學報
천진대학학보
Journal of Tianjin University
2015年
9期
757-760
,共4页
张卫强%宋贝利%蔡猛%刘加
張衛彊%宋貝利%蔡猛%劉加
장위강%송패리%채맹%류가
样例查询%语音关键词检测%DNN输出层特征%动态时间规整
樣例查詢%語音關鍵詞檢測%DNN輸齣層特徵%動態時間規整
양례사순%어음관건사검측%DNN수출층특정%동태시간규정
query-by-example%spoken term detection%deep neural network output features%dynamic time warping
低资源条件下的语音关键词检测是一个具有挑战性的问题,因为传统的基于大词汇量连续语音识别(LVCSR)的语音关键词检测方法不再适用.针对此问题提出了一种基于深度神经网络(DNN)输出层后验概率特征和改进的动态时间规整(DTW)算法的语音关键词检测方法.采用无监督高斯混合模型(GMM)和中、英文 DNN 音素模型得出的输入特征构建互补的子系统,并在 SWS2013 多语种数据集上进行实验.结果表明:相对于基线系统,分数层面的多语种、多系统融合能够有效地提升语音关键词检测系统的性能.
低資源條件下的語音關鍵詞檢測是一箇具有挑戰性的問題,因為傳統的基于大詞彙量連續語音識彆(LVCSR)的語音關鍵詞檢測方法不再適用.針對此問題提齣瞭一種基于深度神經網絡(DNN)輸齣層後驗概率特徵和改進的動態時間規整(DTW)算法的語音關鍵詞檢測方法.採用無鑑督高斯混閤模型(GMM)和中、英文 DNN 音素模型得齣的輸入特徵構建互補的子繫統,併在 SWS2013 多語種數據集上進行實驗.結果錶明:相對于基線繫統,分數層麵的多語種、多繫統融閤能夠有效地提升語音關鍵詞檢測繫統的性能.
저자원조건하적어음관건사검측시일개구유도전성적문제,인위전통적기우대사회량련속어음식별(LVCSR)적어음관건사검측방법불재괄용.침대차문제제출료일충기우심도신경망락(DNN)수출층후험개솔특정화개진적동태시간규정(DTW)산법적어음관건사검측방법.채용무감독고사혼합모형(GMM)화중、영문 DNN 음소모형득출적수입특정구건호보적자계통,병재 SWS2013 다어충수거집상진행실험.결과표명:상대우기선계통,분수층면적다어충、다계통융합능구유효지제승어음관건사검측계통적성능.
Spoken term detection in low-resource situations is a challenging task,because traditional large vocabu-lary continuous speech recognition(LVCSR)approaches are often unusable.We propose a query-by-example(QBE) spoken term detection(STD)method based on deep neural network(DNN)posteriorgram features and a modified dy-namic time warping(DTW)research approach.Subsystems are built with unsupervised Gaussian mixture model (GMM)and DNN monophone models trained on Chinese and English languages. The subsystems are then evaluated on the SWS2013 multilingual database of low-resource languages.The score-level fusion of these different languages and different subsystems is shown to improve performance significantly compared with the baseline results.