价值工程
價值工程
개치공정
VALUE ENGINEERING
2014年
2期
180-181,182
,共3页
KNN%相对距离%准确率
KNN%相對距離%準確率
KNN%상대거리%준학솔
KNN%relative-distance%precision
分类是数据挖掘的重要组成部分,它根据类标号已知的数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。KNN方法作为一种简单、有效、非参数的分类方法,在文本分类中得到广泛的应用,但是这种方法在训练样本的分布不均匀时会造成分类准确率的下降。针对KNN方法存在的这个问题,本文提出了一种基于相对距离的KNN分类方法,这种方法减少了边界点处测试样本的误判。实验结果显示,这种方法具有很好的性能。
分類是數據挖掘的重要組成部分,它根據類標號已知的數據建立模型,進而使用該模型來預測類標號未知的數據所屬的類。KNN方法作為一種簡單、有效、非參數的分類方法,在文本分類中得到廣汎的應用,但是這種方法在訓練樣本的分佈不均勻時會造成分類準確率的下降。針對KNN方法存在的這箇問題,本文提齣瞭一種基于相對距離的KNN分類方法,這種方法減少瞭邊界點處測試樣本的誤判。實驗結果顯示,這種方法具有很好的性能。
분류시수거알굴적중요조성부분,타근거류표호이지적수거건립모형,진이사용해모형래예측류표호미지적수거소속적류。KNN방법작위일충간단、유효、비삼수적분류방법,재문본분류중득도엄범적응용,단시저충방법재훈련양본적분포불균균시회조성분류준학솔적하강。침대KNN방법존재적저개문제,본문제출료일충기우상대거리적KNN분류방법,저충방법감소료변계점처측시양본적오판。실험결과현시,저충방법구유흔호적성능。
Classification is an essential part of data mining. It builds a model according to the data whose class labels are known, and then uses this model to predict the classes of the data whose class labels are unknown. As a simple, effective and nonparametric classification method, KNN method is widely used in document classification. But KNN classifier may decrease the precision of classification because of the uneven density of training data. In this paper, a relative-distance method which solves problem mentioned above is presented. It decreases the wrong classification between the edge of classes. The experiment also shows that it has good performance.