科学技术与工程
科學技術與工程
과학기술여공정
SCIENCE TECHNOLOGY AND ENGINEERING
2011年
12期
2680-2685
,共6页
KNN%上采样%不均衡数据集%聚类%遗传交叉%遗传变异
KNN%上採樣%不均衡數據集%聚類%遺傳交扠%遺傳變異
KNN%상채양%불균형수거집%취류%유전교차%유전변이
传统的K-最邻近(K Nearest Neighbor,KNN)分类算法在处理不均衡样本数据时,其分类器预测倾向于多数类,少数类分类误差大.针对此问题从数据层的角度改进了传统的KNN算法.先通过K-means聚类算法将少数类样本聚类分组,将每个聚类内的样本作为遗传算法的初始种群;再使用遗传交叉和变异操作获取新样本,并进行有效性验证.最终获取到各类别样本数量基本均衡的训练样本集合.实验结果表明此方法有效改善了KNN算法对少数类分类效果.此法同时适用于其他关注少数类分类精度的不均衡数据集分类问题.
傳統的K-最鄰近(K Nearest Neighbor,KNN)分類算法在處理不均衡樣本數據時,其分類器預測傾嚮于多數類,少數類分類誤差大.針對此問題從數據層的角度改進瞭傳統的KNN算法.先通過K-means聚類算法將少數類樣本聚類分組,將每箇聚類內的樣本作為遺傳算法的初始種群;再使用遺傳交扠和變異操作穫取新樣本,併進行有效性驗證.最終穫取到各類彆樣本數量基本均衡的訓練樣本集閤.實驗結果錶明此方法有效改善瞭KNN算法對少數類分類效果.此法同時適用于其他關註少數類分類精度的不均衡數據集分類問題.
전통적K-최린근(K Nearest Neighbor,KNN)분류산법재처리불균형양본수거시,기분류기예측경향우다수류,소수류분류오차대.침대차문제종수거층적각도개진료전통적KNN산법.선통과K-means취류산법장소수류양본취류분조,장매개취류내적양본작위유전산법적초시충군;재사용유전교차화변이조작획취신양본,병진행유효성험증.최종획취도각유별양본수량기본균형적훈련양본집합.실험결과표명차방법유효개선료KNN산법대소수류분류효과.차법동시괄용우기타관주소수류분류정도적불균형수거집분류문제.