佳木斯大学学报(自然科学版)
佳木斯大學學報(自然科學版)
가목사대학학보(자연과학판)
JOURNAL OF JIAMUSI UNIVERSITY (NATURAL SCIENCE EDITION)
2013年
2期
242-244,248
,共4页
苟和平%景永霞%冯百明%李勇
茍和平%景永霞%馮百明%李勇
구화평%경영하%풍백명%리용
KNN分类%聚类%样本裁剪%相似度阈值
KNN分類%聚類%樣本裁剪%相似度閾值
KNN분류%취류%양본재전%상사도역치
KNN算法在分类准确率和召回率方面具有较好的性能,但由于样本相似度计算开销大,导致分类效率低.针对此问题,本文提出一种基于密度的训练样本裁剪算法,对训练样本的各个样本类进行聚类,根据密度不同聚集成不同的簇,删除噪声数据并计算每个样本类的相似度阈值,然后将样本类内大于类相似度阈值的样本进行合并,以减少训练样本总数.实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,实现各个样本类内高相似度样本的合并,减少分类计算开销.
KNN算法在分類準確率和召迴率方麵具有較好的性能,但由于樣本相似度計算開銷大,導緻分類效率低.針對此問題,本文提齣一種基于密度的訓練樣本裁剪算法,對訓練樣本的各箇樣本類進行聚類,根據密度不同聚集成不同的簇,刪除譟聲數據併計算每箇樣本類的相似度閾值,然後將樣本類內大于類相似度閾值的樣本進行閤併,以減少訓練樣本總數.實驗錶明,此樣本裁剪算法能夠在保持KNN算法分類性能基本穩定的前提下,實現各箇樣本類內高相似度樣本的閤併,減少分類計算開銷.
KNN산법재분류준학솔화소회솔방면구유교호적성능,단유우양본상사도계산개소대,도치분류효솔저.침대차문제,본문제출일충기우밀도적훈련양본재전산법,대훈련양본적각개양본류진행취류,근거밀도불동취집성불동적족,산제조성수거병계산매개양본류적상사도역치,연후장양본류내대우류상사도역치적양본진행합병,이감소훈련양본총수.실험표명,차양본재전산법능구재보지KNN산법분류성능기본은정적전제하,실현각개양본류내고상사도양본적합병,감소분류계산개소.