安阳师范学院学报
安暘師範學院學報
안양사범학원학보
JOURNAL OF ANYANG TEACHERS COLLEGE
2013年
5期
49-52
,共4页
汉语分词%三词位%条件随机场%特征模板%上下文窗口
漢語分詞%三詞位%條件隨機場%特徵模闆%上下文窗口
한어분사%삼사위%조건수궤장%특정모판%상하문창구
借助于统计语言模型将汉语分词转换为字序列标注并实现汉语分词已经成为近年来汉语分词的主流方法,但统计语言模型训练时间较长一直是这一方法中的最大问题.提出了一种基于三词位的字标注汉语分词方法,并在bakeoff2005提供的语料上进行了对比实验,结果表明该方法可以取得接近四词位字标注分词方法的性能,但在模型的训练时间上明显优于四词位标注方法.
藉助于統計語言模型將漢語分詞轉換為字序列標註併實現漢語分詞已經成為近年來漢語分詞的主流方法,但統計語言模型訓練時間較長一直是這一方法中的最大問題.提齣瞭一種基于三詞位的字標註漢語分詞方法,併在bakeoff2005提供的語料上進行瞭對比實驗,結果錶明該方法可以取得接近四詞位字標註分詞方法的性能,但在模型的訓練時間上明顯優于四詞位標註方法.
차조우통계어언모형장한어분사전환위자서렬표주병실현한어분사이경성위근년래한어분사적주류방법,단통계어언모형훈련시간교장일직시저일방법중적최대문제.제출료일충기우삼사위적자표주한어분사방법,병재bakeoff2005제공적어료상진행료대비실험,결과표명해방법가이취득접근사사위자표주분사방법적성능,단재모형적훈련시간상명현우우사사위표주방법.