计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2012年
20期
160-163,168
,共5页
王超学%潘正茂%马春森%董丽丽%张涛
王超學%潘正茂%馬春森%董麗麗%張濤
왕초학%반정무%마춘삼%동려려%장도
不平衡数据集%分类%K最邻近算法%权重分配模型%遗传算法%K-means算法
不平衡數據集%分類%K最鄰近算法%權重分配模型%遺傳算法%K-means算法
불평형수거집%분류%K최린근산법%권중분배모형%유전산법%K-means산법
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类.为此,提出一种加权KNN算法GAK-KNN.定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类.基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法.
K最鄰近(KNN)算法對不平衡數據集進行分類時分類判決總會傾嚮于多數類.為此,提齣一種加權KNN算法GAK-KNN.定義新的權重分配模型,綜閤攷慮類間分佈不平衡及類內分佈不均勻的不良影響,採用基于遺傳算法的K-means算法對訓練樣本集進行聚類,按照權重分配模型計算各訓練樣本的權重,通過改進的KNN算法對測試樣本進行分類.基于UCI數據集的大量實驗結果錶明,GAK-KNN算法的識彆率和整體性能都優于傳統KNN算法及其他改進算法.
K최린근(KNN)산법대불평형수거집진행분류시분류판결총회경향우다수류.위차,제출일충가권KNN산법GAK-KNN.정의신적권중분배모형,종합고필류간분포불평형급류내분포불균균적불량영향,채용기우유전산법적K-means산법대훈련양본집진행취류,안조권중분배모형계산각훈련양본적권중,통과개진적KNN산법대측시양본진행분류.기우UCI수거집적대량실험결과표명,GAK-KNN산법적식별솔화정체성능도우우전통KNN산법급기타개진산법.