计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2012年
5期
177-179,212
,共4页
垃圾博客过滤%词频特征%自相似特征%组合特征%贝叶斯分类
垃圾博客過濾%詞頻特徵%自相似特徵%組閤特徵%貝葉斯分類
랄급박객과려%사빈특정%자상사특정%조합특정%패협사분류
近几年,垃圾博客过滤成为国际上新的热点研究领域.现有的过滤算法大多基于词频特征分类,特征冗余并缺乏关联性.为了解决此问题,提出一种基于组合特征的动态垃圾博客过滤算法(CFDSD),该算法采用作者属性和自相似特征来解决特征冗余和关联性低的问题,并应用贝叶斯分类算法优化词频特征分类.实验表明,该算法能适应博客随时间变化而动态更新的特点,同时提高了过滤效率.
近幾年,垃圾博客過濾成為國際上新的熱點研究領域.現有的過濾算法大多基于詞頻特徵分類,特徵冗餘併缺乏關聯性.為瞭解決此問題,提齣一種基于組閤特徵的動態垃圾博客過濾算法(CFDSD),該算法採用作者屬性和自相似特徵來解決特徵冗餘和關聯性低的問題,併應用貝葉斯分類算法優化詞頻特徵分類.實驗錶明,該算法能適應博客隨時間變化而動態更新的特點,同時提高瞭過濾效率.
근궤년,랄급박객과려성위국제상신적열점연구영역.현유적과려산법대다기우사빈특정분류,특정용여병결핍관련성.위료해결차문제,제출일충기우조합특정적동태랄급박객과려산법(CFDSD),해산법채용작자속성화자상사특정래해결특정용여화관련성저적문제,병응용패협사분류산법우화사빈특정분류.실험표명,해산법능괄응박객수시간변화이동태경신적특점,동시제고료과려효솔.