计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2012年
7期
250-252,275
,共4页
特征选择%TFIDF%KNN分类算法
特徵選擇%TFIDF%KNN分類算法
특정선택%TFIDF%KNN분류산법
在分析比较几种常用的特征选择方法的基础上,提出了一种引入文本类区分加权频率的特征选择方法TFIDF_Ci.它将具体类的文档出现频率引入TFIDF函数,提高了特征项所在文档所属类区分其他类的能力.实验中采用KNN分类算法对该方法和其他特征选择方法进行了比较测试.结果表明,TFIDF Ci方法较其他方法在不同的训练集规模情况下具有更高的分类精度和稳定性.
在分析比較幾種常用的特徵選擇方法的基礎上,提齣瞭一種引入文本類區分加權頻率的特徵選擇方法TFIDF_Ci.它將具體類的文檔齣現頻率引入TFIDF函數,提高瞭特徵項所在文檔所屬類區分其他類的能力.實驗中採用KNN分類算法對該方法和其他特徵選擇方法進行瞭比較測試.結果錶明,TFIDF Ci方法較其他方法在不同的訓練集規模情況下具有更高的分類精度和穩定性.
재분석비교궤충상용적특정선택방법적기출상,제출료일충인입문본류구분가권빈솔적특정선택방법TFIDF_Ci.타장구체류적문당출현빈솔인입TFIDF함수,제고료특정항소재문당소속류구분기타류적능력.실험중채용KNN분류산법대해방법화기타특정선택방법진행료비교측시.결과표명,TFIDF Ci방법교기타방법재불동적훈련집규모정황하구유경고적분류정도화은정성.