计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2013年
2期
429-431,435
,共4页
吐尔地·托合提%艾克白尔·帕塔尔%艾斯卡尔·艾木都拉
吐爾地·託閤提%艾剋白爾·帕塔爾%艾斯卡爾·艾木都拉
토이지·탁합제%애극백이·파탑이%애사잡이·애목도랍
维吾尔文%传统分词%语义词%互信息%组词
維吾爾文%傳統分詞%語義詞%互信息%組詞
유오이문%전통분사%어의사%호신식%조사
传统的分词方法将一个维吾尔文语义词(多词关联模式)拆分成与词意义不符的若干个片段,因此在维吾尔语文本分析及文本处理过程中导致许多问题,严重影响文本处理效率.提出了一种维吾尔文组词的全新概念,用互信息作为相邻单词间关联程度的度量,实现了基于分段式策略和增量式策略的两种自适应组词算法,并与传统的分词方法得到的词汇表进行对比分析.实验结果表明,组词算法能够非常有效地提取文本中的语义词,两种算法在大规模文本集上的组词准确率分别达到了84.31%和88.24%.
傳統的分詞方法將一箇維吾爾文語義詞(多詞關聯模式)拆分成與詞意義不符的若榦箇片段,因此在維吾爾語文本分析及文本處理過程中導緻許多問題,嚴重影響文本處理效率.提齣瞭一種維吾爾文組詞的全新概唸,用互信息作為相鄰單詞間關聯程度的度量,實現瞭基于分段式策略和增量式策略的兩種自適應組詞算法,併與傳統的分詞方法得到的詞彙錶進行對比分析.實驗結果錶明,組詞算法能夠非常有效地提取文本中的語義詞,兩種算法在大規模文本集上的組詞準確率分彆達到瞭84.31%和88.24%.
전통적분사방법장일개유오이문어의사(다사관련모식)탁분성여사의의불부적약간개편단,인차재유오이어문본분석급문본처리과정중도치허다문제,엄중영향문본처리효솔.제출료일충유오이문조사적전신개념,용호신식작위상린단사간관련정도적도량,실현료기우분단식책략화증량식책략적량충자괄응조사산법,병여전통적분사방법득도적사회표진행대비분석.실험결과표명,조사산법능구비상유효지제취문본중적어의사,량충산법재대규모문본집상적조사준학솔분별체도료84.31%화88.24%.