计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2007年
35期
126-129
,共4页
李军辉%李培峰%朱巧明%钱培德
李軍輝%李培峰%硃巧明%錢培德
리군휘%리배봉%주교명%전배덕
最大熵模型%邮件分类%特征%层次分类
最大熵模型%郵件分類%特徵%層次分類
최대적모형%유건분류%특정%층차분류
邮件分类是指在给定的分类体系下,根据邮件的内容和属性,确定其类别标签的过程.将最大熵模型应用于邮件分类中,给出了邮件的预处理过程,介绍了邮件信头特征,分析比较了特征数量和迭代次数、邮件特征字段对分类结果的影响,以及对层次分类和平面分类的效果进行了比较.实验表明,特征数量和迭代次数分别取2 000和250时为宜;充分利用邮件各字段信息,取得的总体分类效果最好,但对合法邮件,利用邮件头及邮件标题却取得了最好结果,并在层次分类中验证了这点,层次分类效果要优于平面分类.最后进行了总结和展望.
郵件分類是指在給定的分類體繫下,根據郵件的內容和屬性,確定其類彆標籤的過程.將最大熵模型應用于郵件分類中,給齣瞭郵件的預處理過程,介紹瞭郵件信頭特徵,分析比較瞭特徵數量和迭代次數、郵件特徵字段對分類結果的影響,以及對層次分類和平麵分類的效果進行瞭比較.實驗錶明,特徵數量和迭代次數分彆取2 000和250時為宜;充分利用郵件各字段信息,取得的總體分類效果最好,但對閤法郵件,利用郵件頭及郵件標題卻取得瞭最好結果,併在層次分類中驗證瞭這點,層次分類效果要優于平麵分類.最後進行瞭總結和展望.
유건분류시지재급정적분류체계하,근거유건적내용화속성,학정기유별표첨적과정.장최대적모형응용우유건분류중,급출료유건적예처리과정,개소료유건신두특정,분석비교료특정수량화질대차수、유건특정자단대분류결과적영향,이급대층차분류화평면분류적효과진행료비교.실험표명,특정수량화질대차수분별취2 000화250시위의;충분이용유건각자단신식,취득적총체분류효과최호,단대합법유건,이용유건두급유건표제각취득료최호결과,병재층차분류중험증료저점,층차분류효과요우우평면분류.최후진행료총결화전망.