计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2014年
6期
1359-1372
,共14页
张俊三%瞿有利%税仪冬%田盛丰
張俊三%瞿有利%稅儀鼕%田盛豐
장준삼%구유리%세의동%전성봉
相关实体发现%实体排序%实体类型相关度%实体关系相关度%Wikipedia
相關實體髮現%實體排序%實體類型相關度%實體關繫相關度%Wikipedia
상관실체발현%실체배서%실체류형상관도%실체관계상관도%Wikipedia
related%entity%finding%entity%ranking%entity-type%relevancy%entity-relation%relevancy%Wikipedia
针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关度3方面的组合计算来对实体进行排序,通过对比多种组合方法获取了最优的方法.提出了一种新的实体类型相关度计算方法,该方法可以自动获取细粒度的目标实体类型,并通过归纳学习获取其下义Wikipedia类别判别规则集合,通过统计候选实体类别信息中符合目标类型下义类别判别规则的类别数来计算实体类型相关度.提出了一种”去停止词重构关系”方法计算候选实体和源实体的关系相关度.实验表明提出的方法可以有效地提高实体排序效果并且降低计算时间耗费.
針對相關實體髮現中基于Wikipedia的實體排序存在的問題:半自動的目標類型穫取、粗粒度的目標類型、實體類型相關度二值判斷、實體關繫相關度計算未攷慮停止詞作用.設計瞭一箇實體排序框架,從實體相關度、實體類型相關度和實體關繫相關度3方麵的組閤計算來對實體進行排序,通過對比多種組閤方法穫取瞭最優的方法.提齣瞭一種新的實體類型相關度計算方法,該方法可以自動穫取細粒度的目標實體類型,併通過歸納學習穫取其下義Wikipedia類彆判彆規則集閤,通過統計候選實體類彆信息中符閤目標類型下義類彆判彆規則的類彆數來計算實體類型相關度.提齣瞭一種”去停止詞重構關繫”方法計算候選實體和源實體的關繫相關度.實驗錶明提齣的方法可以有效地提高實體排序效果併且降低計算時間耗費.
침대상관실체발현중기우Wikipedia적실체배서존재적문제:반자동적목표류형획취、조립도적목표류형、실체류형상관도이치판단、실체관계상관도계산미고필정지사작용.설계료일개실체배서광가,종실체상관도、실체류형상관도화실체관계상관도3방면적조합계산래대실체진행배서,통과대비다충조합방법획취료최우적방법.제출료일충신적실체류형상관도계산방법,해방법가이자동획취세립도적목표실체류형,병통과귀납학습획취기하의Wikipedia유별판별규칙집합,통과통계후선실체유별신식중부합목표류형하의유별판별규칙적유별수래계산실체류형상관도.제출료일충”거정지사중구관계”방법계산후선실체화원실체적관계상관도.실험표명제출적방법가이유효지제고실체배서효과병차강저계산시간모비.