中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2014年
4期
132-139
,共8页
未登录词%紧缩词%交集型歧义
未登錄詞%緊縮詞%交集型歧義
미등록사%긴축사%교집형기의
out-of-vocabulary word%abbreviation%overlapping ambiguity
在分析现有的藏语自动分词方法基础上,该文通过分析藏文构词规则、句法结构、词的前后词性关系、后加字(R)的添接法和格助词的用法等来重点研究了未登录词、紧缩词和交集型歧义的识别及处理方法,并提出了“重组法”,“排除—还原法”和“词性规则法”三种方法.经测试,在文学类、诗歌类、医学类和新闻类等大小为1M的藏语语料中未登录词、紧缩词和交集型歧义的识别准确率分别达到99.84%、99.95%和92.02%.
在分析現有的藏語自動分詞方法基礎上,該文通過分析藏文構詞規則、句法結構、詞的前後詞性關繫、後加字(R)的添接法和格助詞的用法等來重點研究瞭未登錄詞、緊縮詞和交集型歧義的識彆及處理方法,併提齣瞭“重組法”,“排除—還原法”和“詞性規則法”三種方法.經測試,在文學類、詩歌類、醫學類和新聞類等大小為1M的藏語語料中未登錄詞、緊縮詞和交集型歧義的識彆準確率分彆達到99.84%、99.95%和92.02%.
재분석현유적장어자동분사방법기출상,해문통과분석장문구사규칙、구법결구、사적전후사성관계、후가자(R)적첨접법화격조사적용법등래중점연구료미등록사、긴축사화교집형기의적식별급처리방법,병제출료“중조법”,“배제—환원법”화“사성규칙법”삼충방법.경측시,재문학류、시가류、의학류화신문류등대소위1M적장어어료중미등록사、긴축사화교집형기의적식별준학솔분별체도99.84%、99.95%화92.02%.