计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2015年
2期
272-281
,共10页
卡方统计量%边界熵%领域适应性%自举算法%中文分词%社会计算%社交网络
卡方統計量%邊界熵%領域適應性%自舉算法%中文分詞%社會計算%社交網絡
잡방통계량%변계적%영역괄응성%자거산법%중문분사%사회계산%사교망락
chi-square statistics%boundary entropy%domain adaptability%bootstrapping method%Chinese Word Segmentation (CWS)%social computing%social networks
字标注分词方法是当前中文分词领域中一种较为有效的分词方法.但因为受制于训练语料的领域和规模,该方法在领域适应性方面效果不佳,影响了该方法在应用系统中的实际应用.在文中,作者提出使用卡方统计量以及边界熵提升未登录词的处理能力,并结合自学习和协同学习策略进一步改善字标注分词方法在领域适应性方面的性能.实验结果证实,文中提出的这些方法有效改善了分词方法的领域适应性.
字標註分詞方法是噹前中文分詞領域中一種較為有效的分詞方法.但因為受製于訓練語料的領域和規模,該方法在領域適應性方麵效果不佳,影響瞭該方法在應用繫統中的實際應用.在文中,作者提齣使用卡方統計量以及邊界熵提升未登錄詞的處理能力,併結閤自學習和協同學習策略進一步改善字標註分詞方法在領域適應性方麵的性能.實驗結果證實,文中提齣的這些方法有效改善瞭分詞方法的領域適應性.
자표주분사방법시당전중문분사영역중일충교위유효적분사방법.단인위수제우훈련어료적영역화규모,해방법재영역괄응성방면효과불가,영향료해방법재응용계통중적실제응용.재문중,작자제출사용잡방통계량이급변계적제승미등록사적처리능력,병결합자학습화협동학습책략진일보개선자표주분사방법재영역괄응성방면적성능.실험결과증실,문중제출적저사방법유효개선료분사방법적영역괄응성.