山东大学学报(工学版)
山東大學學報(工學版)
산동대학학보(공학판)
JOURNAL OF SHANDONG UNIVERSITY(ENGINEERING SCIENCE)
2014年
6期
32-37,76
,共7页
邵发%黄银阁%周兰江%郭剑毅%余正涛%张金鹏
邵髮%黃銀閣%週蘭江%郭劍毅%餘正濤%張金鵬
소발%황은각%주란강%곽검의%여정도%장금붕
关系抽取%实体消歧%贝叶斯分类%模式合并%维基百科
關繫抽取%實體消歧%貝葉斯分類%模式閤併%維基百科
관계추취%실체소기%패협사분류%모식합병%유기백과
entity relation extraction%entity disambiguation%Bayesian classification%pattern merging%Wikipedia
针对开放文本中中文实体关系抽取的一词多义问题,提出一种基于实体消歧的中文实体关系抽取方法。首先,从知网中挖掘出具有潜在语义关系的实体对,并利用贝叶斯分类的语义消歧方法实现从知网到维基百科的实体映射,以获取高质量的关系实例;然后,根据这些关系实例抽取出其对应文本中共现的句子实例,构建基本的抽取模式;最后通过模式合并的方法生成新模式,再使用新模式来抽取新实例。实验结果表明,该方法与没有进行语义消歧和模式合并的方法相比准确率有所提高。
針對開放文本中中文實體關繫抽取的一詞多義問題,提齣一種基于實體消歧的中文實體關繫抽取方法。首先,從知網中挖掘齣具有潛在語義關繫的實體對,併利用貝葉斯分類的語義消歧方法實現從知網到維基百科的實體映射,以穫取高質量的關繫實例;然後,根據這些關繫實例抽取齣其對應文本中共現的句子實例,構建基本的抽取模式;最後通過模式閤併的方法生成新模式,再使用新模式來抽取新實例。實驗結果錶明,該方法與沒有進行語義消歧和模式閤併的方法相比準確率有所提高。
침대개방문본중중문실체관계추취적일사다의문제,제출일충기우실체소기적중문실체관계추취방법。수선,종지망중알굴출구유잠재어의관계적실체대,병이용패협사분류적어의소기방법실현종지망도유기백과적실체영사,이획취고질량적관계실례;연후,근거저사관계실례추취출기대응문본중공현적구자실례,구건기본적추취모식;최후통과모식합병적방법생성신모식,재사용신모식래추취신실례。실험결과표명,해방법여몰유진행어의소기화모식합병적방법상비준학솔유소제고。
To solve the polysemy problem in Chinese Entity Relation Extraction in open text,a Chinese entity relation extraction method based on entity disambiguation was proposed.First,mining entity relation pairs from HowNet,and the entities were mapped from HowNet to Wikipedia by using disambiguation method based on Bayesian classification so as to obtain high-quality relationship instance;Then,extracting the sentence instances in the corresponding context with these relation instances,to construct a basic extraction pattern;Finally,extracting new cases use the new pattern.The experimental results showed that the accuracy of the proposed method was higher than the methods without semantic dis-ambiguation and pattern merging.