西华大学学报(自然科学版)
西華大學學報(自然科學版)
서화대학학보(자연과학판)
Journal of Xihua University(Natural Science Edition)
2015年
5期
16-23,74
,共9页
支持向量机%不均衡数据集%样本密度%欠取样%K-近邻
支持嚮量機%不均衡數據集%樣本密度%欠取樣%K-近鄰
지지향량궤%불균형수거집%양본밀도%흠취양%K-근린
support vector machine%imbalanced dataset%sample density%under-sampling%K-nearest neighbor
针对不均衡数据下分类超平面偏移、少数类识别率较低的问题,提出一种基于样本密度的不均衡数据分类算法.该算法首先计算样本密度和类样本密度,依据类样本密度之间的关系确定聚类类数,然后利用K-means聚类算法对多数类样本进行聚类,用聚类所得类中心作为样本集取代原多数类样本集,最后对新构造的训练集进行训练得到最终决策函数.其实验结果表明,该算法能够提高SVM在不均衡数据下的分类性能,尤其是少数类的分类性能.
針對不均衡數據下分類超平麵偏移、少數類識彆率較低的問題,提齣一種基于樣本密度的不均衡數據分類算法.該算法首先計算樣本密度和類樣本密度,依據類樣本密度之間的關繫確定聚類類數,然後利用K-means聚類算法對多數類樣本進行聚類,用聚類所得類中心作為樣本集取代原多數類樣本集,最後對新構造的訓練集進行訓練得到最終決策函數.其實驗結果錶明,該算法能夠提高SVM在不均衡數據下的分類性能,尤其是少數類的分類性能.
침대불균형수거하분류초평면편이、소수류식별솔교저적문제,제출일충기우양본밀도적불균형수거분류산법.해산법수선계산양본밀도화류양본밀도,의거류양본밀도지간적관계학정취류류수,연후이용K-means취류산법대다수류양본진행취류,용취류소득류중심작위양본집취대원다수류양본집,최후대신구조적훈련집진행훈련득도최종결책함수.기실험결과표명,해산법능구제고SVM재불균형수거하적분류성능,우기시소수류적분류성능.