计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2010年
2期
183-185
,共3页
信息抽取%实体关系%模式匹配%相似度
信息抽取%實體關繫%模式匹配%相似度
신식추취%실체관계%모식필배%상사도
Information extraction%Entity relation%Pattern match%Similarity
中文信息抽取系统中实体关系模式的自动获取对于整个系统具有重要意义.在bootstrap方法的基础上,根据汉语在形式表达上的多样性特点,使用统计学习技术采自动获取新模式.实验表明,该方法在人工干预很少的情况下,能够快速查找新模式,且新模式的获取不受应用领域限制.因此该方法对于提高信息抽取系统的性能是有效的.
中文信息抽取繫統中實體關繫模式的自動穫取對于整箇繫統具有重要意義.在bootstrap方法的基礎上,根據漢語在形式錶達上的多樣性特點,使用統計學習技術採自動穫取新模式.實驗錶明,該方法在人工榦預很少的情況下,能夠快速查找新模式,且新模式的穫取不受應用領域限製.因此該方法對于提高信息抽取繫統的性能是有效的.
중문신식추취계통중실체관계모식적자동획취대우정개계통구유중요의의.재bootstrap방법적기출상,근거한어재형식표체상적다양성특점,사용통계학습기술채자동획취신모식.실험표명,해방법재인공간예흔소적정황하,능구쾌속사조신모식,차신모식적획취불수응용영역한제.인차해방법대우제고신식추취계통적성능시유효적.
Obtaining Chinese entity relation pattern automatically is very important for entire information extraction system.Based on method of bootstrap and features that Chinese can express sanle meaning by many forms,using technology of statistical learning to obtain new pattern automatically.Experiment shows the method can find new pattern rapidly and need very small manual work,the process can't he limited by extract region.So the method is effective for promoting the function of information extraction system.