计算机科学与探索
計算機科學與探索
계산궤과학여탐색
JOURNAL OF FRONTIERS OF COMPUTER SCIENCE & TECHNOLOGY
2012年
7期
644-653
,共10页
朱顺痣%施华%刘利钊%叶东毅
硃順痣%施華%劉利釗%葉東毅
주순지%시화%류리쇠%협동의
分类%高斯核%尺度空间%凸壳%非平衡数据集
分類%高斯覈%呎度空間%凸殼%非平衡數據集
분류%고사핵%척도공간%철각%비평형수거집
将线性尺度空间的特征点扩展问题转化为多尺度数据集的同尺度内分类问题,该问题属于尺度不变的非平衡数据集分类问题.提出了一种基于尺度空间的核学习的采样算法来处理支持向量机(support vector machine,SVM)在非平衡数据集上的分类问题.其核心思想是首先在核空间中对少数类样本进行上采样,然后通过输入空间和核空间的距离关系寻找所合成样本在输入空间的原像,最后再采用SVM对其进行训练,从而有效克服了目前采样方法在不同空间处理训练样本所带来的数据不一致问题.该算法所采用的采样策略不仅能够降低数据失衡率,而且能够拓展少数类样本所形成的凸壳,从而更为有效地纠正最优分类超平面偏移问题.实验结果证明,所获得的结果分类器具有更好的泛化性能,能够在同尺度内有效扩展稳定特征点数量.
將線性呎度空間的特徵點擴展問題轉化為多呎度數據集的同呎度內分類問題,該問題屬于呎度不變的非平衡數據集分類問題.提齣瞭一種基于呎度空間的覈學習的採樣算法來處理支持嚮量機(support vector machine,SVM)在非平衡數據集上的分類問題.其覈心思想是首先在覈空間中對少數類樣本進行上採樣,然後通過輸入空間和覈空間的距離關繫尋找所閤成樣本在輸入空間的原像,最後再採用SVM對其進行訓練,從而有效剋服瞭目前採樣方法在不同空間處理訓練樣本所帶來的數據不一緻問題.該算法所採用的採樣策略不僅能夠降低數據失衡率,而且能夠拓展少數類樣本所形成的凸殼,從而更為有效地糾正最優分類超平麵偏移問題.實驗結果證明,所穫得的結果分類器具有更好的汎化性能,能夠在同呎度內有效擴展穩定特徵點數量.
장선성척도공간적특정점확전문제전화위다척도수거집적동척도내분류문제,해문제속우척도불변적비평형수거집분류문제.제출료일충기우척도공간적핵학습적채양산법래처리지지향량궤(support vector machine,SVM)재비평형수거집상적분류문제.기핵심사상시수선재핵공간중대소수류양본진행상채양,연후통과수입공간화핵공간적거리관계심조소합성양본재수입공간적원상,최후재채용SVM대기진행훈련,종이유효극복료목전채양방법재불동공간처리훈련양본소대래적수거불일치문제.해산법소채용적채양책략불부능구강저수거실형솔,이차능구탁전소수류양본소형성적철각,종이경위유효지규정최우분류초평면편이문제.실험결과증명,소획득적결과분류기구유경호적범화성능,능구재동척도내유효확전은정특정점수량.