计算机科学
計算機科學
계산궤과학
Computer Science
2015年
9期
249-252,267
,共5页
李克文%杨磊%刘文英%刘璐%刘洪太
李剋文%楊磊%劉文英%劉璐%劉洪太
리극문%양뢰%류문영%류로%류홍태
不平衡数据%组合数据采样%Boosting%RSBoost
不平衡數據%組閤數據採樣%Boosting%RSBoost
불평형수거%조합수거채양%Boosting%RSBoost
Imbalanced data%Mixed data sampling%Boosting,RSBoost
不平衡数据的分类问题在多个应用领域中普遍存在,已成为数据挖掘和机器学习领域的研究热点.提出了一种新的不平衡数据分类方法RSBoost,以解决传统分类方法对于少数类识别率不高和分类效率低的问题.该方法采用SMOTE方法对少数类进行过采样处理,然后对整个数据集进行随机欠采样处理,以改善整个数据集的不平衡性,再将其与Boosting算法相结合来对数据进行分类.通过实验对比了5种方法在多个公共数据集上的分类效果和分类效率,结果表明该方法具有较高的分类识别率和分类效率.
不平衡數據的分類問題在多箇應用領域中普遍存在,已成為數據挖掘和機器學習領域的研究熱點.提齣瞭一種新的不平衡數據分類方法RSBoost,以解決傳統分類方法對于少數類識彆率不高和分類效率低的問題.該方法採用SMOTE方法對少數類進行過採樣處理,然後對整箇數據集進行隨機欠採樣處理,以改善整箇數據集的不平衡性,再將其與Boosting算法相結閤來對數據進行分類.通過實驗對比瞭5種方法在多箇公共數據集上的分類效果和分類效率,結果錶明該方法具有較高的分類識彆率和分類效率.
불평형수거적분류문제재다개응용영역중보편존재,이성위수거알굴화궤기학습영역적연구열점.제출료일충신적불평형수거분류방법RSBoost,이해결전통분류방법대우소수류식별솔불고화분류효솔저적문제.해방법채용SMOTE방법대소수류진행과채양처리,연후대정개수거집진행수궤흠채양처리,이개선정개수거집적불평형성,재장기여Boosting산법상결합래대수거진행분류.통과실험대비료5충방법재다개공공수거집상적분류효과화분류효솔,결과표명해방법구유교고적분류식별솔화분류효솔.