北京化工大学学报(自然科学版)
北京化工大學學報(自然科學版)
북경화공대학학보(자연과학판)
JOURNAL OF BEIJING UNIVERSITY OF CHEMICAL TECHNOLOGY(NATURAL SCIENCE EDITION)
2013年
z1期
72-75
,共4页
文本分类%特征选择%词频反文档频率算法%类别区分度
文本分類%特徵選擇%詞頻反文檔頻率算法%類彆區分度
문본분류%특정선택%사빈반문당빈솔산법%유별구분도
text classification%feature selection%term frequency inverse document frequency (TFIDF) algorithm%class discrimination
针对词频反文档频率(TFIDF)算法的缺陷,引入类别区分度理论改进传统的TFIDF算法.通过比较改进TFIDF算法与其他几种常用特征选择算法的分类效果,证明了改进TFIDF算法用于中文文本分类时,准确率和召回率要优于其他算法,改进TFIDF算法具有较好的特征选择效果.
針對詞頻反文檔頻率(TFIDF)算法的缺陷,引入類彆區分度理論改進傳統的TFIDF算法.通過比較改進TFIDF算法與其他幾種常用特徵選擇算法的分類效果,證明瞭改進TFIDF算法用于中文文本分類時,準確率和召迴率要優于其他算法,改進TFIDF算法具有較好的特徵選擇效果.
침대사빈반문당빈솔(TFIDF)산법적결함,인입유별구분도이론개진전통적TFIDF산법.통과비교개진TFIDF산법여기타궤충상용특정선택산법적분류효과,증명료개진TFIDF산법용우중문문본분류시,준학솔화소회솔요우우기타산법,개진TFIDF산법구유교호적특정선택효과.