计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2013年
5期
174-177,182
,共5页
彭永供%邱桃荣%林于渊%黄海泉
彭永供%邱桃榮%林于淵%黃海泉
팽영공%구도영%림우연%황해천
雷电预报%非平衡数据%欠采样算法%哈夫曼树%支持向量机
雷電預報%非平衡數據%欠採樣算法%哈伕曼樹%支持嚮量機
뇌전예보%비평형수거%흠채양산법%합부만수%지지향량궤
lightning forecasting%imbalance data%undersampled algorithm%Huffman tree%Support Vector Machine(SVM)
对具有非平衡特征的海量雷电气象数据集,采用基于欧式距离的样本欠采样算法时效率较低.为解决该问题,提出一种基于哈夫曼树的雷电数据采样算法.使用哈夫曼树构建方法估算雷电样本的簇中心及簇内样本个数,利用得到的结果并结合欧式距离的样本欠采样算法进行非雷电样本采样.对27 552条真实数据做采样实验,结果表明,该算法的采样时间约为16 min,不仅能降低数据量,而且能提高算法的时间性能.
對具有非平衡特徵的海量雷電氣象數據集,採用基于歐式距離的樣本欠採樣算法時效率較低.為解決該問題,提齣一種基于哈伕曼樹的雷電數據採樣算法.使用哈伕曼樹構建方法估算雷電樣本的簇中心及簇內樣本箇數,利用得到的結果併結閤歐式距離的樣本欠採樣算法進行非雷電樣本採樣.對27 552條真實數據做採樣實驗,結果錶明,該算法的採樣時間約為16 min,不僅能降低數據量,而且能提高算法的時間性能.
대구유비평형특정적해량뇌전기상수거집,채용기우구식거리적양본흠채양산법시효솔교저.위해결해문제,제출일충기우합부만수적뇌전수거채양산법.사용합부만수구건방법고산뇌전양본적족중심급족내양본개수,이용득도적결과병결합구식거리적양본흠채양산법진행비뇌전양본채양.대27 552조진실수거주채양실험,결과표명,해산법적채양시간약위16 min,불부능강저수거량,이차능제고산법적시간성능.