南昌航空大学学报(自然科学版)
南昌航空大學學報(自然科學版)
남창항공대학학보(자연과학판)
JOURNAL OF NANCHANG HANGKONG UNIVERSITY(NATURAL SCIENCE EDITION)
2012年
2期
1-6
,共6页
不平衡数据分类%Gentle AdaBoost%过抽样算法%样本复制
不平衡數據分類%Gentle AdaBoost%過抽樣算法%樣本複製
불평형수거분류%Gentle AdaBoost%과추양산법%양본복제
传统的Gentle Adaboost方法在处理不平衡数据集的分类问题时,通常采用过抽样方法,以达到数据集的平衡.但这样处理通常会引入难以分类的奇异样本,导致分类器的分类性能下降.为此,针对不平衡数据集分类提出了一种改进的Gentle AdaBoost算法.考虑到传统Gentle AdaBoost算法中容易分类的样本具有较小权重的特点,在分类器的迭代学习过程中,设定一个样本的权重阈值,仅对少数类样本中低权重样本进行复制,然后采用上述数据集进行分类器的训练,得到相应的弱分类器;重复上述步骤进行迭代,在完成平衡数据集的同时,得到强分类器.整个过程可以避免对数据过抽样时引入奇异样本的问题.实验证明了本算法的有效性.
傳統的Gentle Adaboost方法在處理不平衡數據集的分類問題時,通常採用過抽樣方法,以達到數據集的平衡.但這樣處理通常會引入難以分類的奇異樣本,導緻分類器的分類性能下降.為此,針對不平衡數據集分類提齣瞭一種改進的Gentle AdaBoost算法.攷慮到傳統Gentle AdaBoost算法中容易分類的樣本具有較小權重的特點,在分類器的迭代學習過程中,設定一箇樣本的權重閾值,僅對少數類樣本中低權重樣本進行複製,然後採用上述數據集進行分類器的訓練,得到相應的弱分類器;重複上述步驟進行迭代,在完成平衡數據集的同時,得到彊分類器.整箇過程可以避免對數據過抽樣時引入奇異樣本的問題.實驗證明瞭本算法的有效性.
전통적Gentle Adaboost방법재처리불평형수거집적분류문제시,통상채용과추양방법,이체도수거집적평형.단저양처리통상회인입난이분류적기이양본,도치분류기적분류성능하강.위차,침대불평형수거집분류제출료일충개진적Gentle AdaBoost산법.고필도전통Gentle AdaBoost산법중용역분류적양본구유교소권중적특점,재분류기적질대학습과정중,설정일개양본적권중역치,부대소수류양본중저권중양본진행복제,연후채용상술수거집진행분류기적훈련,득도상응적약분류기;중복상술보취진행질대,재완성평형수거집적동시,득도강분류기.정개과정가이피면대수거과추양시인입기이양본적문제.실험증명료본산법적유효성.