中国海洋大学学报(自然科学版)
中國海洋大學學報(自然科學版)
중국해양대학학보(자연과학판)
Periodical of Ocean University of China
2015年
10期
121-126
,共6页
张巍%王永远%贾晓茹%李传越
張巍%王永遠%賈曉茹%李傳越
장외%왕영원%가효여%리전월
文语对齐%有限状态自动机%语言模型%语音识别
文語對齊%有限狀態自動機%語言模型%語音識彆
문어대제%유한상태자동궤%어언모형%어음식별
speech-text alignment%finite state automaton%language model%speech recognition
文语对齐技术是语音识别领域中的一项关键技术.传统文语对齐方法利用语音识别器将文语对齐问题转换成了文本与文本的对齐问题,但是该方法依赖于大量有标注数据训练的声学模型.本文提出一种利用开放识别引擎和基于有限状态自动机的语言模型来得到语音与文本一一对齐数据的算法,来摆脱对于大量标注数据的依赖.实验表明利用该算法得到语音文本数据的准确率为99%,可以用于识别器的训练.接着利用该部分数据训练一个面向要识别领域的声学模型,来对文本和语音进行迭代的,自适应的文语对齐.
文語對齊技術是語音識彆領域中的一項關鍵技術.傳統文語對齊方法利用語音識彆器將文語對齊問題轉換成瞭文本與文本的對齊問題,但是該方法依賴于大量有標註數據訓練的聲學模型.本文提齣一種利用開放識彆引擎和基于有限狀態自動機的語言模型來得到語音與文本一一對齊數據的算法,來襬脫對于大量標註數據的依賴.實驗錶明利用該算法得到語音文本數據的準確率為99%,可以用于識彆器的訓練.接著利用該部分數據訓練一箇麵嚮要識彆領域的聲學模型,來對文本和語音進行迭代的,自適應的文語對齊.
문어대제기술시어음식별영역중적일항관건기술.전통문어대제방법이용어음식별기장문어대제문제전환성료문본여문본적대제문제,단시해방법의뢰우대량유표주수거훈련적성학모형.본문제출일충이용개방식별인경화기우유한상태자동궤적어언모형래득도어음여문본일일대제수거적산법,래파탈대우대량표주수거적의뢰.실험표명이용해산법득도어음문본수거적준학솔위99%,가이용우식별기적훈련.접착이용해부분수거훈련일개면향요식별영역적성학모형,래대문본화어음진행질대적,자괄응적문어대제.