计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
12期
130-132,136
,共4页
特征选择%信息增益%频度%集中度%分散度
特徵選擇%信息增益%頻度%集中度%分散度
특정선택%신식증익%빈도%집중도%분산도
特征选择是文本分类的一个重要环节,它可以有效提高分类精度和效率.在研究文本分类特征选择方法的基础上,分析了信息增益方法的不足,将频度、集中度、分散度应用到信息增益方法上,提出了一种基于信息增益的特征优化选择方法.实验表明,该方法在分类效果与性能上都优于传统方法.
特徵選擇是文本分類的一箇重要環節,它可以有效提高分類精度和效率.在研究文本分類特徵選擇方法的基礎上,分析瞭信息增益方法的不足,將頻度、集中度、分散度應用到信息增益方法上,提齣瞭一種基于信息增益的特徵優化選擇方法.實驗錶明,該方法在分類效果與性能上都優于傳統方法.
특정선택시문본분류적일개중요배절,타가이유효제고분류정도화효솔.재연구문본분류특정선택방법적기출상,분석료신식증익방법적불족,장빈도、집중도、분산도응용도신식증익방법상,제출료일충기우신식증익적특정우화선택방법.실험표명,해방법재분류효과여성능상도우우전통방법.