计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2006年
z3期
46-53
,共8页
凌妍妍%刘伟%王仲远%艾静%孟小峰
凌妍妍%劉偉%王仲遠%艾靜%孟小峰
릉연연%류위%왕중원%애정%맹소봉
Deep%web%web数据库%实体识别%数据合并
Deep%web%web數據庫%實體識彆%數據閤併
Deep%web%web수거고%실체식별%수거합병
互联网上存在着大量可访问的Web数据库,不同web数据库之间存在着内容上的重叠.来自不同web数据库的记录虽然在网页上的表现形式不同,但是可能描述的是同一实体.因此实体识别是Deep web数据集成中数据合并过程里一个必不可少的环节,而且是一个很具有挑战性的工作.对该问题进行了深入的探讨,提出了一种新颖的方法自动完成实体识别,该方法克服了传统的实体识别工作以模式匹配为前提的弊端,并且与领域无关.实验表明,该方法在Deep web环境下可以达到相当高的准确性.
互聯網上存在著大量可訪問的Web數據庫,不同web數據庫之間存在著內容上的重疊.來自不同web數據庫的記錄雖然在網頁上的錶現形式不同,但是可能描述的是同一實體.因此實體識彆是Deep web數據集成中數據閤併過程裏一箇必不可少的環節,而且是一箇很具有挑戰性的工作.對該問題進行瞭深入的探討,提齣瞭一種新穎的方法自動完成實體識彆,該方法剋服瞭傳統的實體識彆工作以模式匹配為前提的弊耑,併且與領域無關.實驗錶明,該方法在Deep web環境下可以達到相噹高的準確性.
호련망상존재착대량가방문적Web수거고,불동web수거고지간존재착내용상적중첩.래자불동web수거고적기록수연재망혈상적표현형식불동,단시가능묘술적시동일실체.인차실체식별시Deep web수거집성중수거합병과정리일개필불가소적배절,이차시일개흔구유도전성적공작.대해문제진행료심입적탐토,제출료일충신영적방법자동완성실체식별,해방법극복료전통적실체식별공작이모식필배위전제적폐단,병차여영역무관.실험표명,해방법재Deep web배경하가이체도상당고적준학성.