计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2012年
15期
56-58
,共3页
信息处理%高频词%藏语抽词%自动分词%语料库%预处理
信息處理%高頻詞%藏語抽詞%自動分詞%語料庫%預處理
신식처리%고빈사%장어추사%자동분사%어료고%예처리
在借鉴汉语基于语料的词抽取技术研究成果的基础上,给出藏语文本预处理方法,并提出一种基于语料库的藏语高频词抽取算法,其中包括藏语文本预处理用噪音字表、紧缩词及其预处理方法和基于语料库的藏语高频词抽取算法.实验结果表明,该算法的准确率达86.22%,召回率达89.79%,F值达87.94%.
在藉鑒漢語基于語料的詞抽取技術研究成果的基礎上,給齣藏語文本預處理方法,併提齣一種基于語料庫的藏語高頻詞抽取算法,其中包括藏語文本預處理用譟音字錶、緊縮詞及其預處理方法和基于語料庫的藏語高頻詞抽取算法.實驗結果錶明,該算法的準確率達86.22%,召迴率達89.79%,F值達87.94%.
재차감한어기우어료적사추취기술연구성과적기출상,급출장어문본예처리방법,병제출일충기우어료고적장어고빈사추취산법,기중포괄장어문본예처리용조음자표、긴축사급기예처리방법화기우어료고적장어고빈사추취산법.실험결과표명,해산법적준학솔체86.22%,소회솔체89.79%,F치체87.94%.