计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2006年
23期
61-63
,共3页
袁明轩%张选平%蒋宇%赵仲孟
袁明軒%張選平%蔣宇%趙仲孟
원명헌%장선평%장우%조중맹
网页噪音%VIPS算法%相似树比较
網頁譟音%VIPS算法%相似樹比較
망혈조음%VIPS산법%상사수비교
一个普通的Web页面可以被分成信息块和噪音块两部分.基于web信息检索的第1步就是过滤掉网页中的噪音块.通过网页的特性可以看出,同层网页大多具有相似的显示风格和噪音块.在VIPS算法的基础上,该文提出一种基于同层网页相似性的匹配算法,这个算法可以被用来过滤网页中的噪音块.通过实验检测,算法可以达到95%以上的准确率.
一箇普通的Web頁麵可以被分成信息塊和譟音塊兩部分.基于web信息檢索的第1步就是過濾掉網頁中的譟音塊.通過網頁的特性可以看齣,同層網頁大多具有相似的顯示風格和譟音塊.在VIPS算法的基礎上,該文提齣一種基于同層網頁相似性的匹配算法,這箇算法可以被用來過濾網頁中的譟音塊.通過實驗檢測,算法可以達到95%以上的準確率.
일개보통적Web혈면가이피분성신식괴화조음괴량부분.기우web신식검색적제1보취시과려도망혈중적조음괴.통과망혈적특성가이간출,동층망혈대다구유상사적현시풍격화조음괴.재VIPS산법적기출상,해문제출일충기우동층망혈상사성적필배산법,저개산법가이피용래과려망혈중적조음괴.통과실험검측,산법가이체도95%이상적준학솔.