中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2009年
1期
79-85,111
,共8页
徐隽%郑佳谦%姚静%牛军钰
徐雋%鄭佳謙%姚靜%牛軍鈺
서준%정가겸%요정%우군옥
计算机应用%中文信息处理%垃圾邮件%流数据%时间流%文本分类%特征选择
計算機應用%中文信息處理%垃圾郵件%流數據%時間流%文本分類%特徵選擇
계산궤응용%중문신식처리%랄급유건%류수거%시간류%문본분류%특정선택
垃圾邮件过滤具有处理规模巨大,数据无限递增、动态变化等流数据特征,传统的垃圾邮件过滤方法利用静态的文本特征提取方法,无法体现流数据特征随时间动态变化的特点.该文提出一种基于时间流特性来实时调整有效特征的垃圾邮件过滤方法,在TREC Spam Track语料集上的测试结果表明,该方法在保证垃圾邮件过滤高准确率的同时,使垃圾邮件过滤计算的时间性能和空间性能更加优化.
垃圾郵件過濾具有處理規模巨大,數據無限遞增、動態變化等流數據特徵,傳統的垃圾郵件過濾方法利用靜態的文本特徵提取方法,無法體現流數據特徵隨時間動態變化的特點.該文提齣一種基于時間流特性來實時調整有效特徵的垃圾郵件過濾方法,在TREC Spam Track語料集上的測試結果錶明,該方法在保證垃圾郵件過濾高準確率的同時,使垃圾郵件過濾計算的時間性能和空間性能更加優化.
랄급유건과려구유처리규모거대,수거무한체증、동태변화등류수거특정,전통적랄급유건과려방법이용정태적문본특정제취방법,무법체현류수거특정수시간동태변화적특점.해문제출일충기우시간류특성래실시조정유효특정적랄급유건과려방법,재TREC Spam Track어료집상적측시결과표명,해방법재보증랄급유건과려고준학솔적동시,사랄급유건과려계산적시간성능화공간성능경가우화.