计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2011年
15期
122-124
,共3页
赵秀宽%阳建宏%黎敏%徐金梧
趙秀寬%暘建宏%黎敏%徐金梧
조수관%양건굉%려민%서금오
不平衡数据集%偏转森林%集成分类器%过抽样
不平衡數據集%偏轉森林%集成分類器%過抽樣
불평형수거집%편전삼림%집성분류기%과추양
传统的机器学习方法在解决不平衡分类间题时,得到的分类器具有很大的偏向性,表现为少数类识别率远低于多数类.为此,在旋转森林分类方法的基础上,提出一种改进的不平衡数据处理方法--偏转森林.通过对少数类进行过抽样改变训练数据的分布以减小数据的不平衡,采用随机抽取的方式确保生成偏转矩阵的样本间存在差异,从而提高集成分类器的分类精度.实验结果表明,该方法能取得较好的分类性能,具有较高的少数类识别正确率和较低的多数类识别错误率.
傳統的機器學習方法在解決不平衡分類間題時,得到的分類器具有很大的偏嚮性,錶現為少數類識彆率遠低于多數類.為此,在鏇轉森林分類方法的基礎上,提齣一種改進的不平衡數據處理方法--偏轉森林.通過對少數類進行過抽樣改變訓練數據的分佈以減小數據的不平衡,採用隨機抽取的方式確保生成偏轉矩陣的樣本間存在差異,從而提高集成分類器的分類精度.實驗結果錶明,該方法能取得較好的分類性能,具有較高的少數類識彆正確率和較低的多數類識彆錯誤率.
전통적궤기학습방법재해결불평형분류간제시,득도적분류기구유흔대적편향성,표현위소수류식별솔원저우다수류.위차,재선전삼림분류방법적기출상,제출일충개진적불평형수거처리방법--편전삼림.통과대소수류진행과추양개변훈련수거적분포이감소수거적불평형,채용수궤추취적방식학보생성편전구진적양본간존재차이,종이제고집성분류기적분류정도.실험결과표명,해방법능취득교호적분류성능,구유교고적소수류식별정학솔화교저적다수류식별착오솔.