无线通信技术
無線通信技術
무선통신기술
WIRELESS COMMUNICATION TECHNOLOGY
2013年
2期
52-56,62
,共6页
邮件过滤%MapReduce%SVM算法%Hadoop%文本分类
郵件過濾%MapReduce%SVM算法%Hadoop%文本分類
유건과려%MapReduce%SVM산법%Hadoop%문본분류
针对海量文本邮件的挖掘过滤需要更大的存储空间、以及更强的计算能力,提出一种基于Hadoop云计算平台的垃圾邮件过滤方法.其思想:把相对孤立的数据集合并成易于云平台处理的大文件集合;依据评估函数构建文本向量,将邮件转换为结构化的描述;基于MapReduce分布式编程模型改进SVM算法,利用集群整体的计算能力求解最优平面.实验表明:该方法能利用廉价的计算机集群代替昂贵的高性能机器实现海量邮件数据的挖掘过滤;并且,分类效率能随着集群规模的扩增而提升较快.
針對海量文本郵件的挖掘過濾需要更大的存儲空間、以及更彊的計算能力,提齣一種基于Hadoop雲計算平檯的垃圾郵件過濾方法.其思想:把相對孤立的數據集閤併成易于雲平檯處理的大文件集閤;依據評估函數構建文本嚮量,將郵件轉換為結構化的描述;基于MapReduce分佈式編程模型改進SVM算法,利用集群整體的計算能力求解最優平麵.實驗錶明:該方法能利用廉價的計算機集群代替昂貴的高性能機器實現海量郵件數據的挖掘過濾;併且,分類效率能隨著集群規模的擴增而提升較快.
침대해량문본유건적알굴과려수요경대적존저공간、이급경강적계산능력,제출일충기우Hadoop운계산평태적랄급유건과려방법.기사상:파상대고립적수거집합병성역우운평태처리적대문건집합;의거평고함수구건문본향량,장유건전환위결구화적묘술;기우MapReduce분포식편정모형개진SVM산법,이용집군정체적계산능력구해최우평면.실험표명:해방법능이용렴개적계산궤집군대체앙귀적고성능궤기실현해량유건수거적알굴과려;병차,분류효솔능수착집군규모적확증이제승교쾌.