计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2015年
9期
2779-2783
,共5页
暗链%链接隐藏方式%锚文本%机器学习%文本分类
暗鏈%鏈接隱藏方式%錨文本%機器學習%文本分類
암련%련접은장방식%묘문본%궤기학습%문본분류
hidden hyperlink%hyperlink hiding techniques%anchor text%machine learning%text classification
互联网搜索引擎排名算法中,外部链接是一个重要因素,而利用链接作弊现象普遍存在于互联网中。暗链是链接作弊其中的一种手段,难以检测和清除,被称为“网络牛皮癣”。为了维护公平的搜索引擎排名机制,保证搜索结果质量,针对暗链这种作弊手段,提出了一种基于机器学习的互联网暗链检测方法,该方法结合网页源码锚文本的特征检测暗链。给出了相关性能分析,在真实的网络环境下的实验验证表明了所提出的方法可行有效。该研究为搜索引擎打击链接隐藏的作弊行为提供了理论和实践支撑。
互聯網搜索引擎排名算法中,外部鏈接是一箇重要因素,而利用鏈接作弊現象普遍存在于互聯網中。暗鏈是鏈接作弊其中的一種手段,難以檢測和清除,被稱為“網絡牛皮癬”。為瞭維護公平的搜索引擎排名機製,保證搜索結果質量,針對暗鏈這種作弊手段,提齣瞭一種基于機器學習的互聯網暗鏈檢測方法,該方法結閤網頁源碼錨文本的特徵檢測暗鏈。給齣瞭相關性能分析,在真實的網絡環境下的實驗驗證錶明瞭所提齣的方法可行有效。該研究為搜索引擎打擊鏈接隱藏的作弊行為提供瞭理論和實踐支撐。
호련망수색인경배명산법중,외부련접시일개중요인소,이이용련접작폐현상보편존재우호련망중。암련시련접작폐기중적일충수단,난이검측화청제,피칭위“망락우피선”。위료유호공평적수색인경배명궤제,보증수색결과질량,침대암련저충작폐수단,제출료일충기우궤기학습적호련망암련검측방법,해방법결합망혈원마묘문본적특정검측암련。급출료상관성능분석,재진실적망락배경하적실험험증표명료소제출적방법가행유효。해연구위수색인경타격련접은장적작폐행위제공료이론화실천지탱。
External link is a critical factor in search engine algorithm,thus link spam is wide spread in Internet.Hidden hy-perlink is one kind of the link spam.It is the "psoriasis"in Internet,and hard to eradicate.In order to strike this cheating behavior and ensure quality of search results,this paper proposd a method to identify Web pages which contain hidden hyper-links based on machine learning.utilizing features of anchor text in HTML code of Web pages.It analyzed the performance of this model,and experiment based on the real Internet environment proves the method propose is effective.This study will pro-vide Search Engines with theoretical and practical support for striking the Web spam cheating.