计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2012年
1期
182-184
,共3页
支持向量机%近似支持向量机%密度加权%不平衡数据
支持嚮量機%近似支持嚮量機%密度加權%不平衡數據
지지향량궤%근사지지향량궤%밀도가권%불평형수거
标准的近似支持向量机( PSVM)用求解正则化最小二乘问题代替了求解二次规划问题,它可以得到一个解析解,从而减少训练时间.但是标准的PSVM没有考虑数据集中正、负样本的分布情况,对所有的样本都赋予了相同的惩罚因子.而在实际问题中,数据集中样本的分布是不平衡的.针对此问题,在PSVM的基础上提出了一种基于密度加权的近似支持向量机(DPSVM),其先计算样本的密度指标,不同的样例有不同的密度信息,因此对不同的样例给予不同的惩罚因子,并将原始优化问题中的惩罚因子由数值变为一个对角矩阵.在UCI数据集上用这种方法进行了实验,并与SVM和PSVM方法进行了比较,结果表明,DPSVM在正负类样本分布不平衡的数据集上有较好的分类性能.
標準的近似支持嚮量機( PSVM)用求解正則化最小二乘問題代替瞭求解二次規劃問題,它可以得到一箇解析解,從而減少訓練時間.但是標準的PSVM沒有攷慮數據集中正、負樣本的分佈情況,對所有的樣本都賦予瞭相同的懲罰因子.而在實際問題中,數據集中樣本的分佈是不平衡的.針對此問題,在PSVM的基礎上提齣瞭一種基于密度加權的近似支持嚮量機(DPSVM),其先計算樣本的密度指標,不同的樣例有不同的密度信息,因此對不同的樣例給予不同的懲罰因子,併將原始優化問題中的懲罰因子由數值變為一箇對角矩陣.在UCI數據集上用這種方法進行瞭實驗,併與SVM和PSVM方法進行瞭比較,結果錶明,DPSVM在正負類樣本分佈不平衡的數據集上有較好的分類性能.
표준적근사지지향량궤( PSVM)용구해정칙화최소이승문제대체료구해이차규화문제,타가이득도일개해석해,종이감소훈련시간.단시표준적PSVM몰유고필수거집중정、부양본적분포정황,대소유적양본도부여료상동적징벌인자.이재실제문제중,수거집중양본적분포시불평형적.침대차문제,재PSVM적기출상제출료일충기우밀도가권적근사지지향량궤(DPSVM),기선계산양본적밀도지표,불동적양례유불동적밀도신식,인차대불동적양례급여불동적징벌인자,병장원시우화문제중적징벌인자유수치변위일개대각구진.재UCI수거집상용저충방법진행료실험,병여SVM화PSVM방법진행료비교,결과표명,DPSVM재정부류양본분포불평형적수거집상유교호적분류성능.