江西师范大学学报(自然科学版)
江西師範大學學報(自然科學版)
강서사범대학학보(자연과학판)
JOURNAL OF JIANGXI NORMAL UNIVERSITY(NATURAL SCIENCES EDITION)
2008年
2期
166-170
,共5页
李石生%刘海博%路小英%王亮
李石生%劉海博%路小英%王亮
리석생%류해박%로소영%왕량
Deep Web%数据抽取%实体识别
Deep Web%數據抽取%實體識彆
Deep Web%수거추취%실체식별
目前,Web上存在很多Deep Web网站,而各个网站的数据表现形式有很大的差别.因此要集成这些网站就需要正确抽取其中的数据,并将其中表示同一实体的数据合并.该文提出了一种基于探测查询的方法来自动完成页面的数据抽取及实体识别工作,该方法通过提交查询可以在提取数据的同时确定实体的各个属性,根据实体的各个属性进行实体识别.实验表明,该方法具有较高的实体识别准确率.
目前,Web上存在很多Deep Web網站,而各箇網站的數據錶現形式有很大的差彆.因此要集成這些網站就需要正確抽取其中的數據,併將其中錶示同一實體的數據閤併.該文提齣瞭一種基于探測查詢的方法來自動完成頁麵的數據抽取及實體識彆工作,該方法通過提交查詢可以在提取數據的同時確定實體的各箇屬性,根據實體的各箇屬性進行實體識彆.實驗錶明,該方法具有較高的實體識彆準確率.
목전,Web상존재흔다Deep Web망참,이각개망참적수거표현형식유흔대적차별.인차요집성저사망참취수요정학추취기중적수거,병장기중표시동일실체적수거합병.해문제출료일충기우탐측사순적방법래자동완성혈면적수거추취급실체식별공작,해방법통과제교사순가이재제취수거적동시학정실체적각개속성,근거실체적각개속성진행실체식별.실험표명,해방법구유교고적실체식별준학솔.