长春工程学院学报(自然科学版)
長春工程學院學報(自然科學版)
장춘공정학원학보(자연과학판)
JOURNAL OF CHANGCHUN INSTITUTE OF TECHNOLOGY
2010年
2期
113-115
,共3页
藏文人名识别%互信息%格助词%人名词典
藏文人名識彆%互信息%格助詞%人名詞典
장문인명식별%호신식%격조사%인명사전
提出了一种基于统计与规则相结合的藏文人名自动识别方法.该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述.根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;在处理汉族音译人名情况时,采用姓氏驱动的方法,很好地解决了藏文文本中汉族人名的识别问题.实验结果表明,该方法具有较高的准确率和召回率.
提齣瞭一種基于統計與規則相結閤的藏文人名自動識彆方法.該方法充分挖掘瞭人名與上下文信息的關聯程度,引入互信息對關聯程度進行瞭定量的描述.根據大規模語料(30.2 M文本語料)的統計數據所建立的規則極大地提高瞭識彆算法的準確率;在處理漢族音譯人名情況時,採用姓氏驅動的方法,很好地解決瞭藏文文本中漢族人名的識彆問題.實驗結果錶明,該方法具有較高的準確率和召迴率.
제출료일충기우통계여규칙상결합적장문인명자동식별방법.해방법충분알굴료인명여상하문신식적관련정도,인입호신식대관련정도진행료정량적묘술.근거대규모어료(30.2 M문본어료)적통계수거소건립적규칙겁대지제고료식별산법적준학솔;재처리한족음역인명정황시,채용성씨구동적방법,흔호지해결료장문문본중한족인명적식별문제.실험결과표명,해방법구유교고적준학솔화소회솔.