科技创新与应用
科技創新與應用
과기창신여응용
Technology Innovation and Application
2013年
20期
80-80
,共1页
图模型%Web%数据库%取样
圖模型%Web%數據庫%取樣
도모형%Web%수거고%취양
由于在 Web 数据库中存在着海量的信息,而这些信息隐藏在具有特定查询能力的查询接口后,从而为了解 Web 数据库的分布、更新等内容特征带来的困难,最终阻碍了 Deep Web 数据集成。文章基于这一问题提出了一种新的数据采样方法,这种方法可以以增量的方式通过查询接口从 Web 数据库中获取近似随机样本,同时利用已经保存在本地的样本记录生成下次查询。
由于在 Web 數據庫中存在著海量的信息,而這些信息隱藏在具有特定查詢能力的查詢接口後,從而為瞭解 Web 數據庫的分佈、更新等內容特徵帶來的睏難,最終阻礙瞭 Deep Web 數據集成。文章基于這一問題提齣瞭一種新的數據採樣方法,這種方法可以以增量的方式通過查詢接口從 Web 數據庫中穫取近似隨機樣本,同時利用已經保存在本地的樣本記錄生成下次查詢。
유우재 Web 수거고중존재착해량적신식,이저사신식은장재구유특정사순능력적사순접구후,종이위료해 Web 수거고적분포、경신등내용특정대래적곤난,최종조애료 Deep Web 수거집성。문장기우저일문제제출료일충신적수거채양방법,저충방법가이이증량적방식통과사순접구종 Web 수거고중획취근사수궤양본,동시이용이경보존재본지적양본기록생성하차사순。