兰州理工大学学报
蘭州理工大學學報
란주리공대학학보
JOURNAL OF LANZHOU UNIVERSITY OF TECHNOLOGY
2014年
5期
86-89
,共4页
机器学习%不平衡数据集%TANC算法%Relief算法
機器學習%不平衡數據集%TANC算法%Relief算法
궤기학습%불평형수거집%TANC산법%Relief산법
machine learning%unbalanced data sets%TANC algorithm%Relief algorithm
传统的分类方法对不平衡数据集进行分类时对数据集中少数类的分类准确率不高,而少数类往往对结果的影响尤为重要.为此提出一种适应于不平衡数据集的改进树扩展型朴素贝叶斯(TANC)算法,该算法首先利用Re-lief算法对样本中的少数类进行权重分配,然后通过训练数据集,使缺失数据补齐,并通过将属性分割成多个有限区间,使连续数据离散化,将修改后的训练集用以训练TANC,最后通过TANC算法对数据集进行分类.基于UCI标准数据集上的实验结果表明,该算法的整体性能优于TANC算法.
傳統的分類方法對不平衡數據集進行分類時對數據集中少數類的分類準確率不高,而少數類往往對結果的影響尤為重要.為此提齣一種適應于不平衡數據集的改進樹擴展型樸素貝葉斯(TANC)算法,該算法首先利用Re-lief算法對樣本中的少數類進行權重分配,然後通過訓練數據集,使缺失數據補齊,併通過將屬性分割成多箇有限區間,使連續數據離散化,將脩改後的訓練集用以訓練TANC,最後通過TANC算法對數據集進行分類.基于UCI標準數據集上的實驗結果錶明,該算法的整體性能優于TANC算法.
전통적분류방법대불평형수거집진행분류시대수거집중소수류적분류준학솔불고,이소수류왕왕대결과적영향우위중요.위차제출일충괄응우불평형수거집적개진수확전형박소패협사(TANC)산법,해산법수선이용Re-lief산법대양본중적소수류진행권중분배,연후통과훈련수거집,사결실수거보제,병통과장속성분할성다개유한구간,사련속수거리산화,장수개후적훈련집용이훈련TANC,최후통과TANC산법대수거집진행분류.기우UCI표준수거집상적실험결과표명,해산법적정체성능우우TANC산법.