计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2010年
11期
167-169
,共3页
聚焦爬虫%遗传算法%小生境%主题相关度
聚焦爬蟲%遺傳算法%小生境%主題相關度
취초파충%유전산법%소생경%주제상관도
为了提高聚焦爬虫的搜索效率,提出一种结合内容评价和链接结构搜索策略的优点并利用小生境遗传算法进行全局寻优的搜索策略.改进遗传算子和小生境遗传算法,将待搜索的网页URL作为遗传个体,采用概率变迁规则和小生境淘汰运算引导搜索方向.实验结果证明,与聚焦爬虫的其他实现技术相比,该策略在抓取主题相关网页时具有更高的查准率和查全率.
為瞭提高聚焦爬蟲的搜索效率,提齣一種結閤內容評價和鏈接結構搜索策略的優點併利用小生境遺傳算法進行全跼尋優的搜索策略.改進遺傳算子和小生境遺傳算法,將待搜索的網頁URL作為遺傳箇體,採用概率變遷規則和小生境淘汰運算引導搜索方嚮.實驗結果證明,與聚焦爬蟲的其他實現技術相比,該策略在抓取主題相關網頁時具有更高的查準率和查全率.
위료제고취초파충적수색효솔,제출일충결합내용평개화련접결구수색책략적우점병이용소생경유전산법진행전국심우적수색책략.개진유전산자화소생경유전산법,장대수색적망혈URL작위유전개체,채용개솔변천규칙화소생경도태운산인도수색방향.실험결과증명,여취초파충적기타실현기술상비,해책략재조취주제상관망혈시구유경고적사준솔화사전솔.