计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2013年
9期
2672-2676
,共5页
刘遵雄%黄志强%郑淑娟%石菲
劉遵雄%黃誌彊%鄭淑娟%石菲
류준웅%황지강%정숙연%석비
向量空间模型%维数约减%最大间隔Semi-NMF%图正则化MNMF%中文垃圾邮件过滤
嚮量空間模型%維數約減%最大間隔Semi-NMF%圖正則化MNMF%中文垃圾郵件過濾
향량공간모형%유수약감%최대간격Semi-NMF%도정칙화MNMF%중문랄급유건과려
vector space model (VSM)%dimensionality reduction%MNMF%GMNMF%Chinese spam filtering
利用向量空间模型表示的文本邮件数据具有高维性,不利于邮件过滤模型的建立,需要对数据进行降维处理.最大间隔Semi-NMF(max-margin semi-nonnegative matrix factorization,MNMF)能够同时实现维数约减和邮件分类,而图正则化NMF能保持数据空间的几何结构.基于以上两种NMF改进模型,提出了图正则化MNMF(graph regularized MNMF,GMNMF)算法,并设计了一个迭代的求解算法.将GMNMF算法及其他相关算法用于中文垃圾邮件过滤实验,结果表明GMNMF算法构建的过滤模型要优于其他较好的算法构建的过滤模型.
利用嚮量空間模型錶示的文本郵件數據具有高維性,不利于郵件過濾模型的建立,需要對數據進行降維處理.最大間隔Semi-NMF(max-margin semi-nonnegative matrix factorization,MNMF)能夠同時實現維數約減和郵件分類,而圖正則化NMF能保持數據空間的幾何結構.基于以上兩種NMF改進模型,提齣瞭圖正則化MNMF(graph regularized MNMF,GMNMF)算法,併設計瞭一箇迭代的求解算法.將GMNMF算法及其他相關算法用于中文垃圾郵件過濾實驗,結果錶明GMNMF算法構建的過濾模型要優于其他較好的算法構建的過濾模型.
이용향량공간모형표시적문본유건수거구유고유성,불리우유건과려모형적건립,수요대수거진행강유처리.최대간격Semi-NMF(max-margin semi-nonnegative matrix factorization,MNMF)능구동시실현유수약감화유건분류,이도정칙화NMF능보지수거공간적궤하결구.기우이상량충NMF개진모형,제출료도정칙화MNMF(graph regularized MNMF,GMNMF)산법,병설계료일개질대적구해산법.장GMNMF산법급기타상관산법용우중문랄급유건과려실험,결과표명GMNMF산법구건적과려모형요우우기타교호적산법구건적과려모형.