计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
4期
9-12,20
,共5页
实体分辨%数据分块%相似度%决策模型
實體分辨%數據分塊%相似度%決策模型
실체분변%수거분괴%상사도%결책모형
Entity resolution%Blocking%Similarity%Decision model
实体分辨是数据集成、信息检索等领域的重要研究内容,目的是发现数据集合中的不同实体和同一实体的不同描述.将实体分辨过程划分为数据分块、记录比较和匹配决策等3个主要步骤.从记录聚集方式的角度介绍了实体分辨的数据分块方法;从字符串划分粒度的角度分析了实体分辨的记录比较方法;从记录关联方式的角度阐述了实体分辨的决策模型.最后对实体分辨研究下一步需要解决的问题进行了展望.
實體分辨是數據集成、信息檢索等領域的重要研究內容,目的是髮現數據集閤中的不同實體和同一實體的不同描述.將實體分辨過程劃分為數據分塊、記錄比較和匹配決策等3箇主要步驟.從記錄聚集方式的角度介紹瞭實體分辨的數據分塊方法;從字符串劃分粒度的角度分析瞭實體分辨的記錄比較方法;從記錄關聯方式的角度闡述瞭實體分辨的決策模型.最後對實體分辨研究下一步需要解決的問題進行瞭展望.
실체분변시수거집성、신식검색등영역적중요연구내용,목적시발현수거집합중적불동실체화동일실체적불동묘술.장실체분변과정화분위수거분괴、기록비교화필배결책등3개주요보취.종기록취집방식적각도개소료실체분변적수거분괴방법;종자부천화분립도적각도분석료실체분변적기록비교방법;종기록관련방식적각도천술료실체분변적결책모형.최후대실체분변연구하일보수요해결적문제진행료전망.