计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2012年
25期
1-4,97
,共5页
刘海峰%陈琦%张以皓
劉海峰%陳琦%張以皓
류해봉%진기%장이호
文本分类%特征选择%互信息%特征降维
文本分類%特徵選擇%互信息%特徵降維
문본분류%특정선택%호신식%특정강유
提出了一种优化互信息文本特征选择方法.针对互信息模型的不足之处主要从三方面进行改进:用权重因子对正、负相关特征加以区分;以修正因子的方式在MI中引入词频信息对低频词进行抑制;针对特征项在文本里的位置差异进行基于位置的特征加权.该方法改善了MI模型的特征选择效率.文本分类实验结果验证了提出的优化互信息特征选择方法的合理性与有效性.
提齣瞭一種優化互信息文本特徵選擇方法.針對互信息模型的不足之處主要從三方麵進行改進:用權重因子對正、負相關特徵加以區分;以脩正因子的方式在MI中引入詞頻信息對低頻詞進行抑製;針對特徵項在文本裏的位置差異進行基于位置的特徵加權.該方法改善瞭MI模型的特徵選擇效率.文本分類實驗結果驗證瞭提齣的優化互信息特徵選擇方法的閤理性與有效性.
제출료일충우화호신식문본특정선택방법.침대호신식모형적불족지처주요종삼방면진행개진:용권중인자대정、부상관특정가이구분;이수정인자적방식재MI중인입사빈신식대저빈사진행억제;침대특정항재문본리적위치차이진행기우위치적특정가권.해방법개선료MI모형적특정선택효솔.문본분류실험결과험증료제출적우화호신식특정선택방법적합이성여유효성.