计算机与应用化学
計算機與應用化學
계산궤여응용화학
COMPUTERS AND APPLIED CHEMISTRY
2006年
4期
329-332
,共4页
祝宇%夏诏杰%聂峰光%郭力
祝宇%夏詔傑%聶峰光%郭力
축우%하조걸%섭봉광%곽력
支持向量机(SVM)%化学主题爬虫%文本分类%搜索引擎
支持嚮量機(SVM)%化學主題爬蟲%文本分類%搜索引擎
지지향량궤(SVM)%화학주제파충%문본분류%수색인경
爬虫是搜索引擎的重要组成部分,它沿着网页中的超链接自动爬行,搜集各种资源.为了提高对特定主题资源的采集效率,文本分类技术被用来指导爬虫的爬行.本文把基于支持向量机的文本自动分类技术应用到化学主题爬虫中,通过SVM分类器对爬行的网页进行打分,用于指导它爬行化学相关网页.通过与基于广度优先算法的非主题爬虫和基于关键词匹配算法的主题爬虫的比较,表明基于SVM分类器的主题爬虫能有效地提高针对化学Web资源的采集效率.
爬蟲是搜索引擎的重要組成部分,它沿著網頁中的超鏈接自動爬行,搜集各種資源.為瞭提高對特定主題資源的採集效率,文本分類技術被用來指導爬蟲的爬行.本文把基于支持嚮量機的文本自動分類技術應用到化學主題爬蟲中,通過SVM分類器對爬行的網頁進行打分,用于指導它爬行化學相關網頁.通過與基于廣度優先算法的非主題爬蟲和基于關鍵詞匹配算法的主題爬蟲的比較,錶明基于SVM分類器的主題爬蟲能有效地提高針對化學Web資源的採集效率.
파충시수색인경적중요조성부분,타연착망혈중적초련접자동파행,수집각충자원.위료제고대특정주제자원적채집효솔,문본분류기술피용래지도파충적파행.본문파기우지지향량궤적문본자동분류기술응용도화학주제파충중,통과SVM분류기대파행적망혈진행타분,용우지도타파행화학상관망혈.통과여기우엄도우선산법적비주제파충화기우관건사필배산법적주제파충적비교,표명기우SVM분류기적주제파충능유효지제고침대화학Web자원적채집효솔.