计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2011年
4期
239-241
,共3页
特征选择%互信息%文本分类
特徵選擇%互信息%文本分類
특정선택%호신식%문본분류
分析了特征选择采用互信息方法时文本分类性能较低的原因,认为与其在特征选择时倾向于选择稀有特征这一缺陷有很大关系.在此基础上,提出了一种基于分散度和平均频度的互信息特征选择方法.实验结果表明,改进后的互信息方法使文本分类性能有明显提高.
分析瞭特徵選擇採用互信息方法時文本分類性能較低的原因,認為與其在特徵選擇時傾嚮于選擇稀有特徵這一缺陷有很大關繫.在此基礎上,提齣瞭一種基于分散度和平均頻度的互信息特徵選擇方法.實驗結果錶明,改進後的互信息方法使文本分類性能有明顯提高.
분석료특정선택채용호신식방법시문본분류성능교저적원인,인위여기재특정선택시경향우선택희유특정저일결함유흔대관계.재차기출상,제출료일충기우분산도화평균빈도적호신식특정선택방법.실험결과표명,개진후적호신식방법사문본분류성능유명현제고.