计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
34期
123-125
,共3页
文本分类%特征选择%互信息%平衡因子%特征分布差异
文本分類%特徵選擇%互信息%平衡因子%特徵分佈差異
문본분류%특정선택%호신식%평형인자%특정분포차이
针对互信息特征选择方法由于没有很好结合正相关特征和负相关特征,影响在不平衡语料集上分类效果的问题,用平衡因子调整正相关和负相关特征比例,加强特征选择时负相关特征的作用.同时引入特征分布差异因子,区分类强相关特征,提高分类效果.最后通过实验证明,改进的互信息特征选择方法具有可行性和有效性.
針對互信息特徵選擇方法由于沒有很好結閤正相關特徵和負相關特徵,影響在不平衡語料集上分類效果的問題,用平衡因子調整正相關和負相關特徵比例,加彊特徵選擇時負相關特徵的作用.同時引入特徵分佈差異因子,區分類彊相關特徵,提高分類效果.最後通過實驗證明,改進的互信息特徵選擇方法具有可行性和有效性.
침대호신식특정선택방법유우몰유흔호결합정상관특정화부상관특정,영향재불평형어료집상분류효과적문제,용평형인자조정정상관화부상관특정비례,가강특정선택시부상관특정적작용.동시인입특정분포차이인자,구분류강상관특정,제고분류효과.최후통과실험증명,개진적호신식특정선택방법구유가행성화유효성.