计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2009年
5期
1663-1666
,共4页
爬行器%主题%面向主题
爬行器%主題%麵嚮主題
파행기%주제%면향주제
虽然通用网络爬行器已经给人们提供了极大的便利,但由于它的综合性不具备面向专业的特点,在准确性和速度等方面存在不足;面向主题的爬行器能弥补这些不足.主要研究面向主题网络爬行器两个方面的问题,即如何充分地定义主题和有效地排序爬行器待下载链接队列中的链接,使得只需访问很少的不相关页面就能够得到很多相关的页面链接.结合网页的半结构化信息特征,提出了一种新的基于内容的爬行策略,实验结果显示是一种寻找主题相关页面很有效的方法.
雖然通用網絡爬行器已經給人們提供瞭極大的便利,但由于它的綜閤性不具備麵嚮專業的特點,在準確性和速度等方麵存在不足;麵嚮主題的爬行器能瀰補這些不足.主要研究麵嚮主題網絡爬行器兩箇方麵的問題,即如何充分地定義主題和有效地排序爬行器待下載鏈接隊列中的鏈接,使得隻需訪問很少的不相關頁麵就能夠得到很多相關的頁麵鏈接.結閤網頁的半結構化信息特徵,提齣瞭一種新的基于內容的爬行策略,實驗結果顯示是一種尋找主題相關頁麵很有效的方法.
수연통용망락파행기이경급인문제공료겁대적편리,단유우타적종합성불구비면향전업적특점,재준학성화속도등방면존재불족;면향주제적파행기능미보저사불족.주요연구면향주제망락파행기량개방면적문제,즉여하충분지정의주제화유효지배서파행기대하재련접대렬중적련접,사득지수방문흔소적불상관혈면취능구득도흔다상관적혈면련접.결합망혈적반결구화신식특정,제출료일충신적기우내용적파행책략,실험결과현시시일충심조주제상관혈면흔유효적방법.