电子与信息学报
電子與信息學報
전자여신식학보
JOURNAL OF ELECTRONICS & INFORMATION TECHNOLOGY
2004年
11期
1714-1720
,共7页
韩兆兵%张化云%张树武%徐波
韓兆兵%張化雲%張樹武%徐波
한조병%장화운%장수무%서파
电话语音识别%动态通道补偿%最大似然估计%最大后验估计
電話語音識彆%動態通道補償%最大似然估計%最大後驗估計
전화어음식별%동태통도보상%최대사연고계%최대후험고계
与桌面环境相比,电话网络环境下的语音识别率仍然还比较低,为了推动电话语音识别在实际中的应用,提高其识别率成了当务之急.先前的研究表明,电话语音识别率明显下降通常是因为测试和训练环境的电话通道不同引起数据失配造成的,因此该文提出基于统计模型的动态通道补偿算法(SMDC)减少它们之间的差异,采用贝叶斯估计算法动态地跟踪电话通道的时变特性.实验结果表明,大词汇量连续语音识别的字误识率(CER)相对降低约27%,孤立词的词误识率(WER)相对降低约30%.同时,算法的结构时延和计算复杂度也比较小,平均时延约200 ms,可以很好地嵌入到实际电话语音识别应用中.
與桌麵環境相比,電話網絡環境下的語音識彆率仍然還比較低,為瞭推動電話語音識彆在實際中的應用,提高其識彆率成瞭噹務之急.先前的研究錶明,電話語音識彆率明顯下降通常是因為測試和訓練環境的電話通道不同引起數據失配造成的,因此該文提齣基于統計模型的動態通道補償算法(SMDC)減少它們之間的差異,採用貝葉斯估計算法動態地跟蹤電話通道的時變特性.實驗結果錶明,大詞彙量連續語音識彆的字誤識率(CER)相對降低約27%,孤立詞的詞誤識率(WER)相對降低約30%.同時,算法的結構時延和計算複雜度也比較小,平均時延約200 ms,可以很好地嵌入到實際電話語音識彆應用中.
여탁면배경상비,전화망락배경하적어음식별솔잉연환비교저,위료추동전화어음식별재실제중적응용,제고기식별솔성료당무지급.선전적연구표명,전화어음식별솔명현하강통상시인위측시화훈련배경적전화통도불동인기수거실배조성적,인차해문제출기우통계모형적동태통도보상산법(SMDC)감소타문지간적차이,채용패협사고계산법동태지근종전화통도적시변특성.실험결과표명,대사회량련속어음식별적자오식솔(CER)상대강저약27%,고립사적사오식솔(WER)상대강저약30%.동시,산법적결구시연화계산복잡도야비교소,평균시연약200 ms,가이흔호지감입도실제전화어음식별응용중.