计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2014年
11期
122-124,129
,共4页
龚炳江%黄彦欣%贾海鑫
龔炳江%黃彥訢%賈海鑫
공병강%황언흔%가해흠
主题爬虫%URL价值评价%主题相关度%空间向量模型
主題爬蟲%URL價值評價%主題相關度%空間嚮量模型
주제파충%URL개치평개%주제상관도%공간향량모형
Topic crawler%URL value evaluation%Topic correlation%Vector space model
通过对主题网络爬虫的研究,设计一个对网络中的矿山设备资源进行收集的主题网络爬虫。设计内容主要包括主题网络爬虫的各个功能模块以及各功能模块实现的方法。例如判定网页主题相关度及URL价值评价等。使用的主要技术为向量空间模型和PageRank算法。矿山设备领域主题网络爬虫的研究与设计为矿山设备领域主题爬虫的实现奠定了基础。
通過對主題網絡爬蟲的研究,設計一箇對網絡中的礦山設備資源進行收集的主題網絡爬蟲。設計內容主要包括主題網絡爬蟲的各箇功能模塊以及各功能模塊實現的方法。例如判定網頁主題相關度及URL價值評價等。使用的主要技術為嚮量空間模型和PageRank算法。礦山設備領域主題網絡爬蟲的研究與設計為礦山設備領域主題爬蟲的實現奠定瞭基礎。
통과대주제망락파충적연구,설계일개대망락중적광산설비자원진행수집적주제망락파충。설계내용주요포괄주제망락파충적각개공능모괴이급각공능모괴실현적방법。례여판정망혈주제상관도급URL개치평개등。사용적주요기술위향량공간모형화PageRank산법。광산설비영역주제망락파충적연구여설계위광산설비영역주제파충적실현전정료기출。
Through the research on topic web crawler, we design a topic web crawler which can collect the mining equipments resources in networks.The content of the design mainly includes each functional module of the topic web crawler and the method to realise these function modules.For example, to judge the correlation of webpage topics and the URL value evaluation, and so on.The main technology it used is the vector space model and the PageRank algorithm.The study and design of the topic crawler for mining equipments field lays a sound foundation for its implementation.