计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2009年
9期
3375-3377
,共3页
deep Web%deep Web爬虫%最优查询%页面聚类
deep Web%deep Web爬蟲%最優查詢%頁麵聚類
deep Web%deep Web파충%최우사순%혈면취류
Deep Web信息通过在网页搜索接口提交查询词获得.通用搜索引擎使用超链接爬取网页,无法索引deep Web数据.为解决此问题,介绍一种基于最优查询的deep Web爬虫,通过从聚类网页中生成最优查询,自动提交查询,最后索引查询结果.实验表明系统能自动、高效地完成多领域deep Web数据爬取.
Deep Web信息通過在網頁搜索接口提交查詢詞穫得.通用搜索引擎使用超鏈接爬取網頁,無法索引deep Web數據.為解決此問題,介紹一種基于最優查詢的deep Web爬蟲,通過從聚類網頁中生成最優查詢,自動提交查詢,最後索引查詢結果.實驗錶明繫統能自動、高效地完成多領域deep Web數據爬取.
Deep Web신식통과재망혈수색접구제교사순사획득.통용수색인경사용초련접파취망혈,무법색인deep Web수거.위해결차문제,개소일충기우최우사순적deep Web파충,통과종취류망혈중생성최우사순,자동제교사순,최후색인사순결과.실험표명계통능자동、고효지완성다영역deep Web수거파취.