哈尔滨理工大学学报
哈爾濱理工大學學報
합이빈리공대학학보
JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY
2014年
1期
49-53
,共5页
邮件过滤%朴素贝叶斯%机器学习
郵件過濾%樸素貝葉斯%機器學習
유건과려%박소패협사%궤기학습
e-mail filterring%naive bayes%machine learning
针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能.采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法.为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法.在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围.从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.
針對樸素貝葉斯算法應用于反垃圾郵件過濾時,其有效性十分依賴于對郵件內容的有效建模,而郵件內容建模方麵研究尚不成熟限製瞭貝葉斯方法在垃圾郵件過濾中的性能.採用瞭三種概率分佈對郵件內容進行建模,據此提齣瞭3種概率分佈下的樸素貝葉斯算法.為瞭提高訓練效率,算法採用瞭一種增量式的垃圾郵件過濾方法.在trec05p-1、trec06p兩箇公開數據集上對這3種貝葉斯算法進行瞭實驗對比,分析齣三種貝葉斯分佈的適用範圍.從不同分佈的郵件內容建模角度齣髮,為過濾垃圾郵件的方法選擇提供瞭有效依據.
침대박소패협사산법응용우반랄급유건과려시,기유효성십분의뢰우대유건내용적유효건모,이유건내용건모방면연구상불성숙한제료패협사방법재랄급유건과려중적성능.채용료삼충개솔분포대유건내용진행건모,거차제출료3충개솔분포하적박소패협사산법.위료제고훈련효솔,산법채용료일충증량식적랄급유건과려방법.재trec05p-1、trec06p량개공개수거집상대저3충패협사산법진행료실험대비,분석출삼충패협사분포적괄용범위.종불동분포적유건내용건모각도출발,위과려랄급유건적방법선택제공료유효의거.