智能计算机与应用
智能計算機與應用
지능계산궤여응용
Computer Study
2014年
3期
77-80
,共4页
中文分词%中文词性标注%联合模型
中文分詞%中文詞性標註%聯閤模型
중문분사%중문사성표주%연합모형
中文分词和词性标注任务作为中文自然语言处理的初始步骤,已经得到广泛的研究.由于中文句子缺乏词边界,所以中文词性标注往往采用管道模式完成:首先对句子进行分词,然后使用分词阶段的结果进行词性标注.然而管道模式中,分词阶段的错误会传递到词性标注阶段,从而降低词性标注效果.近些年来,中文词性标注方面的研究集中在联合模型.联合模型同时完成句子的分词和词性标注任务,不但可以改善错误传递的问题,并且可以通过使用词性标注信息提高分词精度.联合模型分为基于字模型、基于词模型及混合模型.本文对联合模型的分类、训练算法及训练过程中的问题进行详细的阐述和讨论.
中文分詞和詞性標註任務作為中文自然語言處理的初始步驟,已經得到廣汎的研究.由于中文句子缺乏詞邊界,所以中文詞性標註往往採用管道模式完成:首先對句子進行分詞,然後使用分詞階段的結果進行詞性標註.然而管道模式中,分詞階段的錯誤會傳遞到詞性標註階段,從而降低詞性標註效果.近些年來,中文詞性標註方麵的研究集中在聯閤模型.聯閤模型同時完成句子的分詞和詞性標註任務,不但可以改善錯誤傳遞的問題,併且可以通過使用詞性標註信息提高分詞精度.聯閤模型分為基于字模型、基于詞模型及混閤模型.本文對聯閤模型的分類、訓練算法及訓練過程中的問題進行詳細的闡述和討論.
중문분사화사성표주임무작위중문자연어언처리적초시보취,이경득도엄범적연구.유우중문구자결핍사변계,소이중문사성표주왕왕채용관도모식완성:수선대구자진행분사,연후사용분사계단적결과진행사성표주.연이관도모식중,분사계단적착오회전체도사성표주계단,종이강저사성표주효과.근사년래,중문사성표주방면적연구집중재연합모형.연합모형동시완성구자적분사화사성표주임무,불단가이개선착오전체적문제,병차가이통과사용사성표주신식제고분사정도.연합모형분위기우자모형、기우사모형급혼합모형.본문대연합모형적분류、훈련산법급훈련과정중적문제진행상세적천술화토론.