模式识别与人工智能
模式識彆與人工智能
모식식별여인공지능
Moshi Shibie yu Rengong Zhineng
2014年
8期
758-768
,共11页
邵堃%杨春磊%钱立宾%方帅
邵堃%楊春磊%錢立賓%方帥
소곤%양춘뢰%전립빈%방수
半结构化文本%模式匹配%结构化信息%粗粒度抽取结果%领域识别
半結構化文本%模式匹配%結構化信息%粗粒度抽取結果%領域識彆
반결구화문본%모식필배%결구화신식%조립도추취결과%영역식별
Semi-structured Text%Pattern Matching%Structured Information%Coarse-Grained Extraction Result%Domain Recognition
针对半结构化文本的信息抽取粒度较大,不能对抽取结果进行有效语义分析的问题,面向领域提出一种基于模式匹配的结构化信息二次抽取方法。该方法以Web文档形式呈现的半结构化文本为对象,对粗粒度抽取结果进行领域识别,根据识别结果加载相应领域词库。根据模式中各个角色的词性实现模式角色到分词序列词语的映射,从分词序列中抽取出结构化信息,为准确的语义分析提供支持。实验表明该方法能获得更准确的抽取结果。
針對半結構化文本的信息抽取粒度較大,不能對抽取結果進行有效語義分析的問題,麵嚮領域提齣一種基于模式匹配的結構化信息二次抽取方法。該方法以Web文檔形式呈現的半結構化文本為對象,對粗粒度抽取結果進行領域識彆,根據識彆結果加載相應領域詞庫。根據模式中各箇角色的詞性實現模式角色到分詞序列詞語的映射,從分詞序列中抽取齣結構化信息,為準確的語義分析提供支持。實驗錶明該方法能穫得更準確的抽取結果。
침대반결구화문본적신식추취립도교대,불능대추취결과진행유효어의분석적문제,면향영역제출일충기우모식필배적결구화신식이차추취방법。해방법이Web문당형식정현적반결구화문본위대상,대조립도추취결과진행영역식별,근거식별결과가재상응영역사고。근거모식중각개각색적사성실현모식각색도분사서렬사어적영사,종분사서렬중추취출결구화신식,위준학적어의분석제공지지。실험표명해방법능획득경준학적추취결과。
The information extraction results extracted from the semi-structured texts are coarse-grained, which results in ineffective semantic analysis. A structured information extraction method based on pattern matching is proposed. The proposed method is targeted at the web-presented semi-structured texts, and the suitable lexicon is loaded through domain recognition of the coarse-grained extraction results. Roles are mapped to the corresponding words in the word sequence according to the part of speech of the role in the patterns. Thus, the structured information can be extracted and it provides support for the accurate semantic analysis. Experiments show more accurate extraction results can be achieved by the proposed method.