计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2010年
9期
285-287
,共3页
蔡欣宝%郭若飞%赵朋朋%崔志明
蔡訢寶%郭若飛%趙朋朋%崔誌明
채흔보%곽약비%조붕붕%최지명
Web论坛%增量爬虫%站点地图%泊松模型
Web論罈%增量爬蟲%站點地圖%泊鬆模型
Web론단%증량파충%참점지도%박송모형
针对Web论坛站点结构复杂、内容更新快等特点,提出一种针对论坛的增量信息采集算法,使用站点地图重建技术及网页更新频繁度估计方法,根据站点地图选择有效的链接,按照网页更新频度确定网页的采集频度.实验结果表明,该方法是有效的.
針對Web論罈站點結構複雜、內容更新快等特點,提齣一種針對論罈的增量信息採集算法,使用站點地圖重建技術及網頁更新頻繁度估計方法,根據站點地圖選擇有效的鏈接,按照網頁更新頻度確定網頁的採集頻度.實驗結果錶明,該方法是有效的.
침대Web론단참점결구복잡、내용경신쾌등특점,제출일충침대론단적증량신식채집산법,사용참점지도중건기술급망혈경신빈번도고계방법,근거참점지도선택유효적련접,안조망혈경신빈도학정망혈적채집빈도.실험결과표명,해방법시유효적.