微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2007年
6期
193-195
,共3页
主题爬行%Web分析%超链分析%搜索引擎
主題爬行%Web分析%超鏈分析%搜索引擎
주제파행%Web분석%초련분석%수색인경
爬虫是搜索引擎的关键组成部分,本文提出了一种可利用之前爬行数据自动改进其分析算法与种子URL集合的主题爬行算法,并讨论了其首次爬行和再次爬行算法.实验结果表明该算法的准确率在大多数情况下优于基于宽度策略、基于PageRank和基于内容相似度分析的爬虫.
爬蟲是搜索引擎的關鍵組成部分,本文提齣瞭一種可利用之前爬行數據自動改進其分析算法與種子URL集閤的主題爬行算法,併討論瞭其首次爬行和再次爬行算法.實驗結果錶明該算法的準確率在大多數情況下優于基于寬度策略、基于PageRank和基于內容相似度分析的爬蟲.
파충시수색인경적관건조성부분,본문제출료일충가이용지전파행수거자동개진기분석산법여충자URL집합적주제파행산법,병토론료기수차파행화재차파행산법.실험결과표명해산법적준학솔재대다수정황하우우기우관도책략、기우PageRank화기우내용상사도분석적파충.