计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2014年
4期
895-904
,共10页
杨丹%申德荣%聂铁铮%于戈%寇月
楊丹%申德榮%聶鐵錚%于戈%寇月
양단%신덕영%섭철쟁%우과%구월
异构信息空间%实体关联关系挖掘%作者文献网络%结构信息%关联关系约束
異構信息空間%實體關聯關繫挖掘%作者文獻網絡%結構信息%關聯關繫約束
이구신식공간%실체관련관계알굴%작자문헌망락%결구신식%관련관계약속
heterogeneous information spaces%entity association mining%bibliographic network%structural information%association constraint
丰富的实体关联关系是在异构信息空间中进行数据分析、数据挖掘、知识发现和语义查询等许多应用的前提条件和关键所在.然而不同于同构信息网络,由于异构信息空间中实体关联关系的复杂性、多样性和异构性使得实体关联关系挖掘并不是一件简单的任务,更具有挑战性.以作者文献网络为例,提出了一个通用的,由聚类、过滤、推理和量化4步骤组成的异构信息空间中基于聚类的实体关联关系挖掘算法CFRQ4A(clustering,filtering,reasoning and qualifying for associations).CFRQ4A算法不仅利用了异构实体自身的属性值,还利用了异构信息网络的结构(路径)信息;在挖掘过程中引入关联关系约束来保证关联关系的语义和逻辑正确性,并且针对实体关联关系的特点提出了关联强度量化模型.在真实数据集DBLP上的实验结果表明所提出算法是可行和有效的.
豐富的實體關聯關繫是在異構信息空間中進行數據分析、數據挖掘、知識髮現和語義查詢等許多應用的前提條件和關鍵所在.然而不同于同構信息網絡,由于異構信息空間中實體關聯關繫的複雜性、多樣性和異構性使得實體關聯關繫挖掘併不是一件簡單的任務,更具有挑戰性.以作者文獻網絡為例,提齣瞭一箇通用的,由聚類、過濾、推理和量化4步驟組成的異構信息空間中基于聚類的實體關聯關繫挖掘算法CFRQ4A(clustering,filtering,reasoning and qualifying for associations).CFRQ4A算法不僅利用瞭異構實體自身的屬性值,還利用瞭異構信息網絡的結構(路徑)信息;在挖掘過程中引入關聯關繫約束來保證關聯關繫的語義和邏輯正確性,併且針對實體關聯關繫的特點提齣瞭關聯彊度量化模型.在真實數據集DBLP上的實驗結果錶明所提齣算法是可行和有效的.
봉부적실체관련관계시재이구신식공간중진행수거분석、수거알굴、지식발현화어의사순등허다응용적전제조건화관건소재.연이불동우동구신식망락,유우이구신식공간중실체관련관계적복잡성、다양성화이구성사득실체관련관계알굴병불시일건간단적임무,경구유도전성.이작자문헌망락위례,제출료일개통용적,유취류、과려、추리화양화4보취조성적이구신식공간중기우취류적실체관련관계알굴산법CFRQ4A(clustering,filtering,reasoning and qualifying for associations).CFRQ4A산법불부이용료이구실체자신적속성치,환이용료이구신식망락적결구(로경)신식;재알굴과정중인입관련관계약속래보증관련관계적어의화라집정학성,병차침대실체관련관계적특점제출료관련강도양화모형.재진실수거집DBLP상적실험결과표명소제출산법시가행화유효적.