科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2014年
30期
57-61
,共5页
史佳%董昱%魏宏杰%景晓春%史蕾
史佳%董昱%魏宏傑%景曉春%史蕾
사가%동욱%위굉걸%경효춘%사뢰
KNN%局部密度%决策域%类偏斜
KNN%跼部密度%決策域%類偏斜
KNN%국부밀도%결책역%류편사
KNN%partial density%decision domain%class imbalance problem
经典KNN算法和以往的基于密度的改进KNN算法都缺乏对训练样本数据分布的有效性描述,因此会间接影响到分类结果.提出一种基于测试样本近邻决策域内局部密度的改进KNN算法,通过计算各不同类别在近邻决策域内的局部密度,并同时考虑到类间偏斜度的存在,得到各类密度补偿系数和倾斜度平衡因子,从而达到削弱高数量、大密度类别,增强小数量、低密度类别的目的.在UCI数据集上的实验结果表明,该改进算法在保持经典KNN算法分类准确度的基础上,能够提高分类的召回率和F1-measure指标.
經典KNN算法和以往的基于密度的改進KNN算法都缺乏對訓練樣本數據分佈的有效性描述,因此會間接影響到分類結果.提齣一種基于測試樣本近鄰決策域內跼部密度的改進KNN算法,通過計算各不同類彆在近鄰決策域內的跼部密度,併同時攷慮到類間偏斜度的存在,得到各類密度補償繫數和傾斜度平衡因子,從而達到削弱高數量、大密度類彆,增彊小數量、低密度類彆的目的.在UCI數據集上的實驗結果錶明,該改進算法在保持經典KNN算法分類準確度的基礎上,能夠提高分類的召迴率和F1-measure指標.
경전KNN산법화이왕적기우밀도적개진KNN산법도결핍대훈련양본수거분포적유효성묘술,인차회간접영향도분류결과.제출일충기우측시양본근린결책역내국부밀도적개진KNN산법,통과계산각불동유별재근린결책역내적국부밀도,병동시고필도류간편사도적존재,득도각류밀도보상계수화경사도평형인자,종이체도삭약고수량、대밀도유별,증강소수량、저밀도유별적목적.재UCI수거집상적실험결과표명,해개진산법재보지경전KNN산법분류준학도적기출상,능구제고분류적소회솔화F1-measure지표.