南京师大学报(自然科学版)
南京師大學報(自然科學版)
남경사대학보(자연과학판)
JOURNAL OF NANJING NORMAL UNIVERSITY (NATURAL SCIENCE EDITION)
2014年
3期
29-35
,共7页
嵌套命名实体识别%序列化标注模型%联合模型%感知器算法
嵌套命名實體識彆%序列化標註模型%聯閤模型%感知器算法
감투명명실체식별%서렬화표주모형%연합모형%감지기산법
nested named entity recognition%sequence labeling models%joint models%perceptron algorithm
中文嵌套命名实体识别是自然语言处理中一个比较困难的问题。针对传统的序列化标注方法的不足,本文提出了一种新的基于联合模型的中文嵌套命名实体识别方法,该方法将嵌套命名实体识别看作是一种联合切分和标注任务。联合模型用一种改进的beam search算法作为系统的解码算法,并采用一种在线学习算法平均感知器算法作为训练算法,获得了较快的收敛速度和较好的识别效果。实验结果表明基于联合模型的方法对嵌套命名实体识别取得了更好的效果。
中文嵌套命名實體識彆是自然語言處理中一箇比較睏難的問題。針對傳統的序列化標註方法的不足,本文提齣瞭一種新的基于聯閤模型的中文嵌套命名實體識彆方法,該方法將嵌套命名實體識彆看作是一種聯閤切分和標註任務。聯閤模型用一種改進的beam search算法作為繫統的解碼算法,併採用一種在線學習算法平均感知器算法作為訓練算法,穫得瞭較快的收斂速度和較好的識彆效果。實驗結果錶明基于聯閤模型的方法對嵌套命名實體識彆取得瞭更好的效果。
중문감투명명실체식별시자연어언처리중일개비교곤난적문제。침대전통적서렬화표주방법적불족,본문제출료일충신적기우연합모형적중문감투명명실체식별방법,해방법장감투명명실체식별간작시일충연합절분화표주임무。연합모형용일충개진적beam search산법작위계통적해마산법,병채용일충재선학습산법평균감지기산법작위훈련산법,획득료교쾌적수렴속도화교호적식별효과。실험결과표명기우연합모형적방법대감투명명실체식별취득료경호적효과。
Chinese nested named entity recognition is a very difficult problem in natural language processing. This paper presents a novel method based on a joint model,which treats the recognition of Chinese nested named entity as a task of joint word segmentation and labeling. The proposed method exploits an improved beam search algorithm as decoding algorithm,and uses the averaged perceptron algorithm as training algorithm,attaining fast convergence during training. The experimental results show that the joint model achieves better performance than two baseline systems using the traditional sequence labeling models.