电子设计工程
電子設計工程
전자설계공정
ELECTRONIC DESIGN ENGINEERING
2012年
13期
9-11
,共3页
翟军昌%车伟伟%刘艳丽%康建军
翟軍昌%車偉偉%劉豔麗%康建軍
적군창%차위위%류염려%강건군
信息增益%特征选择%垃圾邮件%最小风险贝叶斯
信息增益%特徵選擇%垃圾郵件%最小風險貝葉斯
신식증익%특정선택%랄급유건%최소풍험패협사
information gain%feature selection%spam%risk minimization bayes
信息增益是文本分类中一种有效的特征项选择方法,针对垃圾邮件过滤中的特征项选择问题,提出了一种改进的信息增益方法提取特征词,并采用了最小风险贝叶斯的决策方法,最后在英文语料库上进行实验。实验结果表明改进后的方法降低了过滤器对合法邮件的误判。
信息增益是文本分類中一種有效的特徵項選擇方法,針對垃圾郵件過濾中的特徵項選擇問題,提齣瞭一種改進的信息增益方法提取特徵詞,併採用瞭最小風險貝葉斯的決策方法,最後在英文語料庫上進行實驗。實驗結果錶明改進後的方法降低瞭過濾器對閤法郵件的誤判。
신식증익시문본분류중일충유효적특정항선택방법,침대랄급유건과려중적특정항선택문제,제출료일충개진적신식증익방법제취특정사,병채용료최소풍험패협사적결책방법,최후재영문어료고상진행실험。실험결과표명개진후적방법강저료과려기대합법유건적오판。
The information gain is an effective feature selection method for the text classification, for spam filtering in the feature selection problem, put forward a kind of improved information gain method of extracting feature words, and the use of the minimum risk Bayes decision method, finally in the English Corpus for experiments, the experimental results show that the improved method to reduce the filter of legitimate emails misjudgment.