计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2015年
1期
171-174
,共4页
努尔艾力·喀迪尔%彭良瑞%哈力木拉提
努爾艾力·喀迪爾%彭良瑞%哈力木拉提
노이애력·객적이%팽량서%합력목랍제
隐马尔科夫模型%统计语言模型%维吾尔文%阿拉伯文%识别
隱馬爾科伕模型%統計語言模型%維吾爾文%阿拉伯文%識彆
은마이과부모형%통계어언모형%유오이문%아랍백문%식별
Hidden Markov model%Statistical language model%Uyghur%Arabic%Recognition
维吾尔文和阿拉伯文是采用阿拉伯文字母的从右向左书写的连写文字.它们识别方法的研究对于多文种文本图像内容的利用具有重要意义.利用HTK工具包,分别建立基于隐马尔科夫模型HMM(Hidden Markov Model)的印刷体维吾尔文和阿拉伯文识别系统,其中特征提取部分采用分布密度特征和局部方向特征.研究利用HTK工具建立维吾尔文和阿拉伯文统计语言模型,并将语言模型用于改进识别系统性能.实验结果表明采用统计语言模型可有效提高文字识别系统性能.其中,在包含24 000个单词的印刷体维吾尔文测试集上,通过利用语言模型识别率从78.28%提高到97.45%;在包含759个单词的印刷体阿拉伯文测试集上,通过利用语言模型识别率从79.07%提高到85.80%.
維吾爾文和阿拉伯文是採用阿拉伯文字母的從右嚮左書寫的連寫文字.它們識彆方法的研究對于多文種文本圖像內容的利用具有重要意義.利用HTK工具包,分彆建立基于隱馬爾科伕模型HMM(Hidden Markov Model)的印刷體維吾爾文和阿拉伯文識彆繫統,其中特徵提取部分採用分佈密度特徵和跼部方嚮特徵.研究利用HTK工具建立維吾爾文和阿拉伯文統計語言模型,併將語言模型用于改進識彆繫統性能.實驗結果錶明採用統計語言模型可有效提高文字識彆繫統性能.其中,在包含24 000箇單詞的印刷體維吾爾文測試集上,通過利用語言模型識彆率從78.28%提高到97.45%;在包含759箇單詞的印刷體阿拉伯文測試集上,通過利用語言模型識彆率從79.07%提高到85.80%.
유오이문화아랍백문시채용아랍백문자모적종우향좌서사적련사문자.타문식별방법적연구대우다문충문본도상내용적이용구유중요의의.이용HTK공구포,분별건립기우은마이과부모형HMM(Hidden Markov Model)적인쇄체유오이문화아랍백문식별계통,기중특정제취부분채용분포밀도특정화국부방향특정.연구이용HTK공구건립유오이문화아랍백문통계어언모형,병장어언모형용우개진식별계통성능.실험결과표명채용통계어언모형가유효제고문자식별계통성능.기중,재포함24 000개단사적인쇄체유오이문측시집상,통과이용어언모형식별솔종78.28%제고도97.45%;재포함759개단사적인쇄체아랍백문측시집상,통과이용어언모형식별솔종79.07%제고도85.80%.