计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2013年
5期
132-135
,共4页
张玉芳%王勇%刘明%熊忠阳
張玉芳%王勇%劉明%熊忠暘
장옥방%왕용%류명%웅충양
特征降维%文本分类%特征选择%综合比率%K-最近邻分类算法
特徵降維%文本分類%特徵選擇%綜閤比率%K-最近鄰分類算法
특정강유%문본분류%특정선택%종합비솔%K-최근린분류산법
特征降维是文本分类过程中的一个重要环节.在现有特征选择方法的基础上,综合考虑特征词在正类和负类中的分布性质,综合四种衡量特征类别区分能力的指标,提出了一个新的特征选择方法,即综合比率(CR)方法.实验采用K-最近邻分类算法(KNN)来考查CR方法的有效性,实验结果表明该方法能够取得比现有特征选择方法更优的降维效果.
特徵降維是文本分類過程中的一箇重要環節.在現有特徵選擇方法的基礎上,綜閤攷慮特徵詞在正類和負類中的分佈性質,綜閤四種衡量特徵類彆區分能力的指標,提齣瞭一箇新的特徵選擇方法,即綜閤比率(CR)方法.實驗採用K-最近鄰分類算法(KNN)來攷查CR方法的有效性,實驗結果錶明該方法能夠取得比現有特徵選擇方法更優的降維效果.
특정강유시문본분류과정중적일개중요배절.재현유특정선택방법적기출상,종합고필특정사재정류화부류중적분포성질,종합사충형량특정유별구분능력적지표,제출료일개신적특정선택방법,즉종합비솔(CR)방법.실험채용K-최근린분류산법(KNN)래고사CR방법적유효성,실험결과표명해방법능구취득비현유특정선택방법경우적강유효과.