南京大学学报(自然科学版)
南京大學學報(自然科學版)
남경대학학보(자연과학판)
JOURNAL OF NANJING UNIVERSITY(NATURAL SCIENCES)
2006年
2期
148-155
,共8页
机器学习%数据挖掘%类别不平衡%级联%集成学习
機器學習%數據挖掘%類彆不平衡%級聯%集成學習
궤기학습%수거알굴%유별불평형%급련%집성학습
真实世界问题中,不同类别的样本在数目上往往差别很大,而传统机器学习方法难以对小类样本进行正确分类,若小类的样本是足够重要的,就会带来较大的损失.因此,对类别分布不平衡数据的学习已成为机器学习目前面临的一个挑战.受计算机视觉中级联模型的启发,提出一种针对不平衡数据的分类方法BalanceCascade.该方法逐步缩小大类别使数据集趋于平衡,在此过程中训练得到的一系列分类器通过集成方式对预测样本进行分类.实验结果表明,该方法可以有效地提高在不平衡数据上的分类性能,尤其是在分类性能受数据的不平衡性严重影响的情况下.
真實世界問題中,不同類彆的樣本在數目上往往差彆很大,而傳統機器學習方法難以對小類樣本進行正確分類,若小類的樣本是足夠重要的,就會帶來較大的損失.因此,對類彆分佈不平衡數據的學習已成為機器學習目前麵臨的一箇挑戰.受計算機視覺中級聯模型的啟髮,提齣一種針對不平衡數據的分類方法BalanceCascade.該方法逐步縮小大類彆使數據集趨于平衡,在此過程中訓練得到的一繫列分類器通過集成方式對預測樣本進行分類.實驗結果錶明,該方法可以有效地提高在不平衡數據上的分類性能,尤其是在分類性能受數據的不平衡性嚴重影響的情況下.
진실세계문제중,불동유별적양본재수목상왕왕차별흔대,이전통궤기학습방법난이대소류양본진행정학분류,약소류적양본시족구중요적,취회대래교대적손실.인차,대유별분포불평형수거적학습이성위궤기학습목전면림적일개도전.수계산궤시각중급련모형적계발,제출일충침대불평형수거적분류방법BalanceCascade.해방법축보축소대유별사수거집추우평형,재차과정중훈련득도적일계렬분류기통과집성방식대예측양본진행분류.실험결과표명,해방법가이유효지제고재불평형수거상적분류성능,우기시재분류성능수수거적불평형성엄중영향적정황하.