软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2000年
2期
271-276
,共6页
语音识别%模型训练%三音子%类三音子
語音識彆%模型訓練%三音子%類三音子
어음식별%모형훈련%삼음자%류삼음자
在语音识别中,如何经济地挑选语音训练语料,使其覆盖尽可能多的语音现象是一个非常重要的问题.传统的语音训练语料采用手工挑选后再进行检验和补充的方法,此方法难以保证所选语料语音现象的覆盖率.该文提出了一种自动地从大规模语料库中挑选语料的搜索算法,此算法不但能使所选语料覆盖几乎所有语音现象,而且能保证训练语料中三音子和类三音子有足够的样本个数,使训练数据不过于稀疏,为训练正确而可靠的语音模型打下了坚实的基础.
在語音識彆中,如何經濟地挑選語音訓練語料,使其覆蓋儘可能多的語音現象是一箇非常重要的問題.傳統的語音訓練語料採用手工挑選後再進行檢驗和補充的方法,此方法難以保證所選語料語音現象的覆蓋率.該文提齣瞭一種自動地從大規模語料庫中挑選語料的搜索算法,此算法不但能使所選語料覆蓋幾乎所有語音現象,而且能保證訓練語料中三音子和類三音子有足夠的樣本箇數,使訓練數據不過于稀疏,為訓練正確而可靠的語音模型打下瞭堅實的基礎.
재어음식별중,여하경제지도선어음훈련어료,사기복개진가능다적어음현상시일개비상중요적문제.전통적어음훈련어료채용수공도선후재진행검험화보충적방법,차방법난이보증소선어료어음현상적복개솔.해문제출료일충자동지종대규모어료고중도선어료적수색산법,차산법불단능사소선어료복개궤호소유어음현상,이차능보증훈련어료중삼음자화류삼음자유족구적양본개수,사훈련수거불과우희소,위훈련정학이가고적어음모형타하료견실적기출.