计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2013年
2期
184-187,245
,共5页
王超学%潘正茂%董丽丽%马春森%张星
王超學%潘正茂%董麗麗%馬春森%張星
왕초학%반정무%동려려%마춘삼%장성
非平衡数据集%分类%支持度%轮盘赌选择%合成少数过采样技术(SMOTE)
非平衡數據集%分類%支持度%輪盤賭選擇%閤成少數過採樣技術(SMOTE)
비평형수거집%분류%지지도%륜반도선택%합성소수과채양기술(SMOTE)
针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE).该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制.将SSMOTE与KNN(K-Nearest Neighbor)算法结合来处理不平衡数据集的分类问题.通过在UCI数据集上与其他重要文献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN在非平衡数据集上的分类性能.
針對SMOTE(Synthetic Minority Over-sampling Technique)在閤成少數類新樣本時存在的不足,提齣瞭一種改進的SMOTE算法(SSMOTE).該算法的關鍵是將支持度概唸和輪盤賭選擇技術引入到SMOTE中,併充分利用瞭異類近鄰的分佈信息,實現瞭對少數類樣本閤成質量和數量的精細控製.將SSMOTE與KNN(K-Nearest Neighbor)算法結閤來處理不平衡數據集的分類問題.通過在UCI數據集上與其他重要文獻中的相關算法進行的大量對比實驗錶明,SSMOTE在新樣本的整體閤成效果上錶現齣色,有效提高瞭KNN在非平衡數據集上的分類性能.
침대SMOTE(Synthetic Minority Over-sampling Technique)재합성소수류신양본시존재적불족,제출료일충개진적SMOTE산법(SSMOTE).해산법적관건시장지지도개념화륜반도선택기술인입도SMOTE중,병충분이용료이류근린적분포신식,실현료대소수류양본합성질량화수량적정세공제.장SSMOTE여KNN(K-Nearest Neighbor)산법결합래처리불평형수거집적분류문제.통과재UCI수거집상여기타중요문헌중적상관산법진행적대량대비실험표명,SSMOTE재신양본적정체합성효과상표현출색,유효제고료KNN재비평형수거집상적분류성능.