中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2013年
4期
30-36
,共7页
刘一佳%车万翔%刘挺%张梅山
劉一佳%車萬翔%劉挺%張梅山
류일가%차만상%류정%장매산
中文分词%词性标注%Stacked Learning
中文分詞%詞性標註%Stacked Learning
중문분사%사성표주%Stacked Learning
Chinese Word Segmentation%POS tagging%Stacked Learning
该文对三种不同的分词词性标注模型进行了比较.这三种模型分别为一个序列标注串行模型,一个基于字分类的联合模型和一个将这两种模型使用Stacked Learning框架进行集成的融合模型.通过在《人民日报》、CoNLL09、CTB5.0和CTB7.0四个数据集上进行比较分析,最终实验结果表明分类联合模型能取得比较好的速度,融合模型能取得比较好的准确率,而普通串行模型处于速度和准确率的平衡位置.最后该文将准确率最好的融合模型和相关前沿工作在CTB5.0和CTB7.0上进行了对比,该融合模型均取得了最好的结果.
該文對三種不同的分詞詞性標註模型進行瞭比較.這三種模型分彆為一箇序列標註串行模型,一箇基于字分類的聯閤模型和一箇將這兩種模型使用Stacked Learning框架進行集成的融閤模型.通過在《人民日報》、CoNLL09、CTB5.0和CTB7.0四箇數據集上進行比較分析,最終實驗結果錶明分類聯閤模型能取得比較好的速度,融閤模型能取得比較好的準確率,而普通串行模型處于速度和準確率的平衡位置.最後該文將準確率最好的融閤模型和相關前沿工作在CTB5.0和CTB7.0上進行瞭對比,該融閤模型均取得瞭最好的結果.
해문대삼충불동적분사사성표주모형진행료비교.저삼충모형분별위일개서렬표주천행모형,일개기우자분류적연합모형화일개장저량충모형사용Stacked Learning광가진행집성적융합모형.통과재《인민일보》、CoNLL09、CTB5.0화CTB7.0사개수거집상진행비교분석,최종실험결과표명분류연합모형능취득비교호적속도,융합모형능취득비교호적준학솔,이보통천행모형처우속도화준학솔적평형위치.최후해문장준학솔최호적융합모형화상관전연공작재CTB5.0화CTB7.0상진행료대비,해융합모형균취득료최호적결과.