南京师大学报(自然科学版)
南京師大學報(自然科學版)
남경사대학보(자연과학판)
JOURNAL OF NANJING NORMAL UNIVERSITY (NATURAL SCIENCE EDITION)
2014年
1期
30-34
,共5页
自然语言处理%中文文本信息抽取%隐马尔科夫模型%句法分析%触发词
自然語言處理%中文文本信息抽取%隱馬爾科伕模型%句法分析%觸髮詞
자연어언처리%중문문본신식추취%은마이과부모형%구법분석%촉발사
natural language processing%information extraction of Chinese text%hidden markov model%syntactic analysis%trigger words
自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向,其中信息抽取是近年来新兴起的一个研究领域。由于汉语自身结构松散、语法语义灵活等特点,使得中文文本中信息抽取具有较大的难度。本文提出句法分析和隐马尔科夫模型相结合的事件属性抽取方法,其主要思想是先利用句法分析对中文文本进行分析,将得到的句法结构交给隐马尔科夫模型进行学习得到一个抽取模型,然后再由此模型对中文文本进行抽取。实验表明,该方法具有较高的准确率和召回率。
自然語言處理技術是計算機科學領域與人工智能領域中的一箇重要方嚮,其中信息抽取是近年來新興起的一箇研究領域。由于漢語自身結構鬆散、語法語義靈活等特點,使得中文文本中信息抽取具有較大的難度。本文提齣句法分析和隱馬爾科伕模型相結閤的事件屬性抽取方法,其主要思想是先利用句法分析對中文文本進行分析,將得到的句法結構交給隱馬爾科伕模型進行學習得到一箇抽取模型,然後再由此模型對中文文本進行抽取。實驗錶明,該方法具有較高的準確率和召迴率。
자연어언처리기술시계산궤과학영역여인공지능영역중적일개중요방향,기중신식추취시근년래신흥기적일개연구영역。유우한어자신결구송산、어법어의령활등특점,사득중문문본중신식추취구유교대적난도。본문제출구법분석화은마이과부모형상결합적사건속성추취방법,기주요사상시선이용구법분석대중문문본진행분석,장득도적구법결구교급은마이과부모형진행학습득도일개추취모형,연후재유차모형대중문문본진행추취。실험표명,해방법구유교고적준학솔화소회솔。
Natural language processing technology is an important direction in the field of computer science and artificial intelligence,and the Chinese text information extraction is a new rising researching field in recent years. Due to the character of the loose structure of Chinese text,the flexibility of grammar and semanteme,the research of Chinese natural language processing has a difficult challenge nowadays. In the paper, a method of the combine of syntactic and HMM (Hidden Markov Model) was proposed. The main idea is to use syntax to analyze the Chinese text,then submit the syntactic structure to HMM and get a HMM model through learning it,finally the event properties can be extracted by the HMM model. The experiment shows that the method has higher precision and recall than normal algorithm.