计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2013年
3期
780-783
,共4页
专业领域分词%分词歧义%字符串频次%互信息%边界熵
專業領域分詞%分詞歧義%字符串頻次%互信息%邊界熵
전업영역분사%분사기의%자부천빈차%호신식%변계적
中文自然语言处理中专业领域分词的难度远远高于通用领域.特别是在专业领域的分词歧义方面,一直没有找到有效的解决方法.针对该问题提出基于无监督学习的专业领域分词歧义消解方法.以测试语料自身的字符串频次信息、互信息、边界熵信息为分词歧义的评价标准,独立、组合地使用这三种信息解决分词歧义问题.实验结果显示该方法可以有效消解专业领域的分词歧义,并明显提高分词效果.
中文自然語言處理中專業領域分詞的難度遠遠高于通用領域.特彆是在專業領域的分詞歧義方麵,一直沒有找到有效的解決方法.針對該問題提齣基于無鑑督學習的專業領域分詞歧義消解方法.以測試語料自身的字符串頻次信息、互信息、邊界熵信息為分詞歧義的評價標準,獨立、組閤地使用這三種信息解決分詞歧義問題.實驗結果顯示該方法可以有效消解專業領域的分詞歧義,併明顯提高分詞效果.
중문자연어언처리중전업영역분사적난도원원고우통용영역.특별시재전업영역적분사기의방면,일직몰유조도유효적해결방법.침대해문제제출기우무감독학습적전업영역분사기의소해방법.이측시어료자신적자부천빈차신식、호신식、변계적신식위분사기의적평개표준,독립、조합지사용저삼충신식해결분사기의문제.실험결과현시해방법가이유효소해전업영역적분사기의,병명현제고분사효과.