计算机仿真
計算機倣真
계산궤방진
COMPUTER SIMULATION
2008年
2期
121-123
,共3页
粘合性衡量%邮件分类%向量空间模型
粘閤性衡量%郵件分類%嚮量空間模型
점합성형량%유건분류%향량공간모형
电子邮件分类一般采用向量空间模型来表示邮件,但是该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征,从而使得特征向量不能准确地表示邮件的内容.针对目前向量空间模型出现的这种缺陷,文中将粘合性衡量方法提取n-gram的思想运用于文本表示当中,对词的权重进行赋值,并以此模型设计了一个邮件分类系统,由于粘合性方法考虑到了邮件的结构特征,实例证明,这种方法能够提高系统的分类精确度.
電子郵件分類一般採用嚮量空間模型來錶示郵件,但是該模型隻是基于獨立詞在郵件內容中齣現的頻率來建立的,而併未攷慮郵件的結構特徵,從而使得特徵嚮量不能準確地錶示郵件的內容.針對目前嚮量空間模型齣現的這種缺陷,文中將粘閤性衡量方法提取n-gram的思想運用于文本錶示噹中,對詞的權重進行賦值,併以此模型設計瞭一箇郵件分類繫統,由于粘閤性方法攷慮到瞭郵件的結構特徵,實例證明,這種方法能夠提高繫統的分類精確度.
전자유건분류일반채용향량공간모형래표시유건,단시해모형지시기우독립사재유건내용중출현적빈솔래건립적,이병미고필유건적결구특정,종이사득특정향량불능준학지표시유건적내용.침대목전향량공간모형출현적저충결함,문중장점합성형량방법제취n-gram적사상운용우문본표시당중,대사적권중진행부치,병이차모형설계료일개유건분류계통,유우점합성방법고필도료유건적결구특정,실예증명,저충방법능구제고계통적분류정학도.