计算机与数字工程
計算機與數字工程
계산궤여수자공정
COMPUTER & DIGITAL ENGINEERING
2007年
4期
190-193
,共4页
向量空间模型%邮件分类%段落结构
嚮量空間模型%郵件分類%段落結構
향량공간모형%유건분류%단락결구
基于内容的邮件分类一般采用向量空间模型来表示邮件,该模型只是基于独立词在邮件内容中出现的频率来建立的,而并未考虑邮件的结构特征和词所在的上下文环境,这使得特征向量不能准确地表示邮件的内容,从而导致分类不够准确.文中提出了改进的向量空间模型,针对邮件特有的结构,以段落为分块单位,通过分析段落间的关系和段落中的内容来更改特征词的权重.以此模型设计了一个邮件分类系统,并对该系统进行了测试和结果分析.
基于內容的郵件分類一般採用嚮量空間模型來錶示郵件,該模型隻是基于獨立詞在郵件內容中齣現的頻率來建立的,而併未攷慮郵件的結構特徵和詞所在的上下文環境,這使得特徵嚮量不能準確地錶示郵件的內容,從而導緻分類不夠準確.文中提齣瞭改進的嚮量空間模型,針對郵件特有的結構,以段落為分塊單位,通過分析段落間的關繫和段落中的內容來更改特徵詞的權重.以此模型設計瞭一箇郵件分類繫統,併對該繫統進行瞭測試和結果分析.
기우내용적유건분류일반채용향량공간모형래표시유건,해모형지시기우독립사재유건내용중출현적빈솔래건립적,이병미고필유건적결구특정화사소재적상하문배경,저사득특정향량불능준학지표시유건적내용,종이도치분류불구준학.문중제출료개진적향량공간모형,침대유건특유적결구,이단락위분괴단위,통과분석단락간적관계화단락중적내용래경개특정사적권중.이차모형설계료일개유건분류계통,병대해계통진행료측시화결과분석.