计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2003年
36期
153-156
,共4页
信息收集%搜索引擎%移动爬虫%WWW
信息收集%搜索引擎%移動爬蟲%WWW
신식수집%수색인경%이동파충%WWW
搜索引擎已经成为网上导航的重要工具.为了能够提供强大的搜索能力,搜索引擎对网上可访问文档维持着详尽的索引.创建和维护索引的任务由网络爬虫完成,网络爬虫代表搜索引擎递归地遍历和下载Web页面.Web页面在下载之后,被搜索引擎分析、建索引,然后提供检索服务.文章介绍了一种更加有效的建立Web索引的方法,该方法是基于移动爬虫(Mobile Crawler)的.在此提出的爬虫首先被传送到数据所在的站点,在那里任何不需要的数据在传回搜索引擎之前在当地被过滤.这个方法尤其适用于实施所谓的"智能"爬行算法,这些算法根据已访问过的Web页面的内容来决定一条有效的爬行路径.移动爬虫是移动计算和专业搜索引擎两大技术趋势的结合,能够从技术上很好地解决现在通用搜索引擎所面临的问题.
搜索引擎已經成為網上導航的重要工具.為瞭能夠提供彊大的搜索能力,搜索引擎對網上可訪問文檔維持著詳儘的索引.創建和維護索引的任務由網絡爬蟲完成,網絡爬蟲代錶搜索引擎遞歸地遍歷和下載Web頁麵.Web頁麵在下載之後,被搜索引擎分析、建索引,然後提供檢索服務.文章介紹瞭一種更加有效的建立Web索引的方法,該方法是基于移動爬蟲(Mobile Crawler)的.在此提齣的爬蟲首先被傳送到數據所在的站點,在那裏任何不需要的數據在傳迴搜索引擎之前在噹地被過濾.這箇方法尤其適用于實施所謂的"智能"爬行算法,這些算法根據已訪問過的Web頁麵的內容來決定一條有效的爬行路徑.移動爬蟲是移動計算和專業搜索引擎兩大技術趨勢的結閤,能夠從技術上很好地解決現在通用搜索引擎所麵臨的問題.
수색인경이경성위망상도항적중요공구.위료능구제공강대적수색능력,수색인경대망상가방문문당유지착상진적색인.창건화유호색인적임무유망락파충완성,망락파충대표수색인경체귀지편력화하재Web혈면.Web혈면재하재지후,피수색인경분석、건색인,연후제공검색복무.문장개소료일충경가유효적건립Web색인적방법,해방법시기우이동파충(Mobile Crawler)적.재차제출적파충수선피전송도수거소재적참점,재나리임하불수요적수거재전회수색인경지전재당지피과려.저개방법우기괄용우실시소위적"지능"파행산법,저사산법근거이방문과적Web혈면적내용래결정일조유효적파행로경.이동파충시이동계산화전업수색인경량대기술추세적결합,능구종기술상흔호지해결현재통용수색인경소면림적문제.