计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2007年
13期
186-190
,共5页
垃圾邮件过滤%朴素贝叶斯%期望交叉熵%特征选取
垃圾郵件過濾%樸素貝葉斯%期望交扠熵%特徵選取
랄급유건과려%박소패협사%기망교차적%특정선취
分析了目前在垃圾邮件过滤中广泛应用的Na(i)ve Bayes过滤模型(NBF),指出了期望交叉熵(ECE)特征词选取方法的不足.提出了改进的Na(i)ve Bayes垃圾邮件过滤模型(A-NBF),用改进的期望交叉熵(AECE)选取垃圾邮件特征词,并在邮件分类过程中对特征词进行加权,从而提高对垃圾邮件过滤的精度.实验结果可以看出A-NBF比NBF在过滤精度方面有明显的提高.
分析瞭目前在垃圾郵件過濾中廣汎應用的Na(i)ve Bayes過濾模型(NBF),指齣瞭期望交扠熵(ECE)特徵詞選取方法的不足.提齣瞭改進的Na(i)ve Bayes垃圾郵件過濾模型(A-NBF),用改進的期望交扠熵(AECE)選取垃圾郵件特徵詞,併在郵件分類過程中對特徵詞進行加權,從而提高對垃圾郵件過濾的精度.實驗結果可以看齣A-NBF比NBF在過濾精度方麵有明顯的提高.
분석료목전재랄급유건과려중엄범응용적Na(i)ve Bayes과려모형(NBF),지출료기망교차적(ECE)특정사선취방법적불족.제출료개진적Na(i)ve Bayes랄급유건과려모형(A-NBF),용개진적기망교차적(AECE)선취랄급유건특정사,병재유건분류과정중대특정사진행가권,종이제고대랄급유건과려적정도.실험결과가이간출A-NBF비NBF재과려정도방면유명현적제고.