计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2006年
10期
204-205,229
,共3页
主题爬虫%主题搜索引擎%化学主题网络爬虫%Widrow-Hoff 分类器
主題爬蟲%主題搜索引擎%化學主題網絡爬蟲%Widrow-Hoff 分類器
주제파충%주제수색인경%화학주제망락파충%Widrow-Hoff 분류기
由于通用搜索引擎检索返回的结果过多、主题相关性不强以及随着人们对提供的各项信息服务的要求越来越高,基于整个Web的信息采集越来越力不从心.同时它无法及时地采集到足够的最新的Web信息,也不能满足人们日益增长的个性化需求.本文通过把Internet化学资源导航系统所积累的化学知识与搜索引擎的自动采集技术相结合展开了对化学主题网络爬虫开发的研究.结果表明,基于Widrow-Hoff分类器的化学主题网络爬虫能有效的采集化学相关的网页.
由于通用搜索引擎檢索返迴的結果過多、主題相關性不彊以及隨著人們對提供的各項信息服務的要求越來越高,基于整箇Web的信息採集越來越力不從心.同時它無法及時地採集到足夠的最新的Web信息,也不能滿足人們日益增長的箇性化需求.本文通過把Internet化學資源導航繫統所積纍的化學知識與搜索引擎的自動採集技術相結閤展開瞭對化學主題網絡爬蟲開髮的研究.結果錶明,基于Widrow-Hoff分類器的化學主題網絡爬蟲能有效的採集化學相關的網頁.
유우통용수색인경검색반회적결과과다、주제상관성불강이급수착인문대제공적각항신식복무적요구월래월고,기우정개Web적신식채집월래월력불종심.동시타무법급시지채집도족구적최신적Web신식,야불능만족인문일익증장적개성화수구.본문통과파Internet화학자원도항계통소적루적화학지식여수색인경적자동채집기술상결합전개료대화학주제망락파충개발적연구.결과표명,기우Widrow-Hoff분류기적화학주제망락파충능유효적채집화학상관적망혈.