郑州大学学报(理学版)
鄭州大學學報(理學版)
정주대학학보(이학판)
JOURNAL OF ZHENGZHOU UNIVERSITY(NATURAL SCIENCE EDITION)
2010年
2期
26-30
,共5页
方育柯%傅彦%周俊临%夏虎
方育柯%傅彥%週俊臨%夏虎
방육가%부언%주준림%하호
主题网络爬虫%不良网页%文本特征
主題網絡爬蟲%不良網頁%文本特徵
주제망락파충%불량망혈%문본특정
针对互联网中出现的大量不良内容,分析出其主要特征,首次提出将不良网页的文本特征与搜索引擎中网络爬虫相结合的技术来主动寻找互联网中的不良网页及不良网站,并将结果分级别反馈到用户层以便对不良网页和网站进行处理,以达到净化网络环境的目的.实验结果表明,所提出的算法能够有效检测不良网页,并且能够很好地应对不良网站的反关键字过滤策略.
針對互聯網中齣現的大量不良內容,分析齣其主要特徵,首次提齣將不良網頁的文本特徵與搜索引擎中網絡爬蟲相結閤的技術來主動尋找互聯網中的不良網頁及不良網站,併將結果分級彆反饋到用戶層以便對不良網頁和網站進行處理,以達到淨化網絡環境的目的.實驗結果錶明,所提齣的算法能夠有效檢測不良網頁,併且能夠很好地應對不良網站的反關鍵字過濾策略.
침대호련망중출현적대량불량내용,분석출기주요특정,수차제출장불량망혈적문본특정여수색인경중망락파충상결합적기술래주동심조호련망중적불량망혈급불량망참,병장결과분급별반궤도용호층이편대불량망혈화망참진행처리,이체도정화망락배경적목적.실험결과표명,소제출적산법능구유효검측불량망혈,병차능구흔호지응대불량망참적반관건자과려책략.