中南大学学报(自然科学版)
中南大學學報(自然科學版)
중남대학학보(자연과학판)
JOURNAL OF CENTRAL SOUTH UNIVERSITY
2013年
7期
2787-2792
,共6页
邮件过滤%特征提取%概率度量%多项式模型%风险评估
郵件過濾%特徵提取%概率度量%多項式模型%風險評估
유건과려%특정제취%개솔도량%다항식모형%풍험평고
mail filtering%feature extraction%probability measurement%polynomial model%risk assessment
针对现有贝叶斯算法应用于垃圾邮件过滤时,贝叶斯贝努利模型对邮件文本特征向量进行处理不能区分特征向量的重要性,导致邮件分类召回率低,同时还存在合法邮件被误判的风险的问题,采用贝叶斯多项式模型对特征向量进行加权处理来区分特征向量的重要性;然后,采用低风险策略来降低合法邮件被误判的风险,提出基于多项式模型和低风险的贝叶斯垃圾邮件过滤算法.实验结果表明:对于不同数量的特征项,该算法能够有效提高邮件分类的正确率与召回率,降低合法邮件被误判的风险,并在过滤文本字符数量较大的邮件时,具有性能平稳、波动小的特点.
針對現有貝葉斯算法應用于垃圾郵件過濾時,貝葉斯貝努利模型對郵件文本特徵嚮量進行處理不能區分特徵嚮量的重要性,導緻郵件分類召迴率低,同時還存在閤法郵件被誤判的風險的問題,採用貝葉斯多項式模型對特徵嚮量進行加權處理來區分特徵嚮量的重要性;然後,採用低風險策略來降低閤法郵件被誤判的風險,提齣基于多項式模型和低風險的貝葉斯垃圾郵件過濾算法.實驗結果錶明:對于不同數量的特徵項,該算法能夠有效提高郵件分類的正確率與召迴率,降低閤法郵件被誤判的風險,併在過濾文本字符數量較大的郵件時,具有性能平穩、波動小的特點.
침대현유패협사산법응용우랄급유건과려시,패협사패노리모형대유건문본특정향량진행처리불능구분특정향량적중요성,도치유건분류소회솔저,동시환존재합법유건피오판적풍험적문제,채용패협사다항식모형대특정향량진행가권처리래구분특정향량적중요성;연후,채용저풍험책략래강저합법유건피오판적풍험,제출기우다항식모형화저풍험적패협사랄급유건과려산법.실험결과표명:대우불동수량적특정항,해산법능구유효제고유건분류적정학솔여소회솔,강저합법유건피오판적풍험,병재과려문본자부수량교대적유건시,구유성능평은、파동소적특점.