哈尔滨工程大学学报
哈爾濱工程大學學報
합이빈공정대학학보
JOURNAL OF HARBIN ENGINEERING UNIVERSITY
2013年
3期
381-388
,共8页
陶新民%郝思媛%张冬雪%徐鹏
陶新民%郝思媛%張鼕雪%徐鵬
도신민%학사원%장동설%서붕
失衡数据%SVM算法%AdaBoost%核聚类%欠取样
失衡數據%SVM算法%AdaBoost%覈聚類%欠取樣
실형수거%SVM산법%AdaBoost%핵취류%흠취양
针对传统SVM算法在失衡数据集下的分类性能不理想的问题,提出一种基于核聚类集成SVM算法.该算法首先在核空间中对多数类样本集进行聚类,然后随机选择出具有代表意义的聚类信息点,实现在减少多数类样本数的同时将分类界面向多数类样本方向偏移.并利用AdaBoost集成手段对基于核聚类的欠取样SVM算法进行集成,最终提高SVM算法在失衡数据下的泛化性能.将提出的算法同其他失衡数据预处理集成方法进行比较,实验结果表明该算法能够有效提高SVM算法在失衡数据中少数类的分类性能,且总体分类性能及运行效率都有明显提高.
針對傳統SVM算法在失衡數據集下的分類性能不理想的問題,提齣一種基于覈聚類集成SVM算法.該算法首先在覈空間中對多數類樣本集進行聚類,然後隨機選擇齣具有代錶意義的聚類信息點,實現在減少多數類樣本數的同時將分類界麵嚮多數類樣本方嚮偏移.併利用AdaBoost集成手段對基于覈聚類的欠取樣SVM算法進行集成,最終提高SVM算法在失衡數據下的汎化性能.將提齣的算法同其他失衡數據預處理集成方法進行比較,實驗結果錶明該算法能夠有效提高SVM算法在失衡數據中少數類的分類性能,且總體分類性能及運行效率都有明顯提高.
침대전통SVM산법재실형수거집하적분류성능불이상적문제,제출일충기우핵취류집성SVM산법.해산법수선재핵공간중대다수류양본집진행취류,연후수궤선택출구유대표의의적취류신식점,실현재감소다수류양본수적동시장분류계면향다수류양본방향편이.병이용AdaBoost집성수단대기우핵취류적흠취양SVM산법진행집성,최종제고SVM산법재실형수거하적범화성능.장제출적산법동기타실형수거예처리집성방법진행비교,실험결과표명해산법능구유효제고SVM산법재실형수거중소수류적분류성능,차총체분류성능급운행효솔도유명현제고.