计算机工程
計算機工程
계산궤공정
Computer Engineering
2015年
9期
311-316
,共6页
分类%主题模型%潜在狄利克雷分配%语义特征%语义相似度
分類%主題模型%潛在狄利剋雷分配%語義特徵%語義相似度
분류%주제모형%잠재적리극뢰분배%어의특정%어의상사도
classification%topic model%Latent Dirichlet Allocation (LDA)%semantic feature%semantic similarity
网页作弊检测可以被看作二元分类问题.当前基于内容的作弊网页检测方法主要使用统计特征,不能准确识别隐藏的作弊手段.为此,提出一种改进的作弊网页检测方法,使用语义与统计两类特征,将作弊检测深入至主题层次.该方法对网页内容进行主题建模,将网页内容映射至主题空间,根据其主题分布进行语义分析计算,从中提取语义特征,结合统计特征对网页进行分类检测.实验结果表明,该方法在精确率、召回率与F1测度上均获得了较好的效果.
網頁作弊檢測可以被看作二元分類問題.噹前基于內容的作弊網頁檢測方法主要使用統計特徵,不能準確識彆隱藏的作弊手段.為此,提齣一種改進的作弊網頁檢測方法,使用語義與統計兩類特徵,將作弊檢測深入至主題層次.該方法對網頁內容進行主題建模,將網頁內容映射至主題空間,根據其主題分佈進行語義分析計算,從中提取語義特徵,結閤統計特徵對網頁進行分類檢測.實驗結果錶明,該方法在精確率、召迴率與F1測度上均穫得瞭較好的效果.
망혈작폐검측가이피간작이원분류문제.당전기우내용적작폐망혈검측방법주요사용통계특정,불능준학식별은장적작폐수단.위차,제출일충개진적작폐망혈검측방법,사용어의여통계량류특정,장작폐검측심입지주제층차.해방법대망혈내용진행주제건모,장망혈내용영사지주제공간,근거기주제분포진행어의분석계산,종중제취어의특정,결합통계특정대망혈진행분류검측.실험결과표명,해방법재정학솔、소회솔여F1측도상균획득료교호적효과.