闽南师范大学学报(自然科学版)
閩南師範大學學報(自然科學版)
민남사범대학학보(자연과학판)
Journal of Zhangzhou Teachers College (Natural Science Edition)
2014年
4期
26-30
,共5页
数据挖掘%分类%不平衡数据%小类
數據挖掘%分類%不平衡數據%小類
수거알굴%분류%불평형수거%소류
传统的分类算法通常设置统一的最小置信度提取规则.如果训练数据集是不平衡的数据,统一置信度的分类算法在小类的准确率不高.本文提出了一种基于训练集类分布的多置信度不平衡数据分类算法CBMI.在CBMI算法中,根据训练数据中类的分布设置不同的最小置信度提取规则,小类置信度的临界值比大类置信度低.此外,算法CBMI综合三种度量选择“好”的属性值.实验结果表明,基于多置信度不平衡数据分类算法CB-MI提高了小类数据分类的正确率.
傳統的分類算法通常設置統一的最小置信度提取規則.如果訓練數據集是不平衡的數據,統一置信度的分類算法在小類的準確率不高.本文提齣瞭一種基于訓練集類分佈的多置信度不平衡數據分類算法CBMI.在CBMI算法中,根據訓練數據中類的分佈設置不同的最小置信度提取規則,小類置信度的臨界值比大類置信度低.此外,算法CBMI綜閤三種度量選擇“好”的屬性值.實驗結果錶明,基于多置信度不平衡數據分類算法CB-MI提高瞭小類數據分類的正確率.
전통적분류산법통상설치통일적최소치신도제취규칙.여과훈련수거집시불평형적수거,통일치신도적분류산법재소류적준학솔불고.본문제출료일충기우훈련집류분포적다치신도불평형수거분류산법CBMI.재CBMI산법중,근거훈련수거중류적분포설치불동적최소치신도제취규칙,소류치신도적림계치비대류치신도저.차외,산법CBMI종합삼충도량선택“호”적속성치.실험결과표명,기우다치신도불평형수거분류산법CB-MI제고료소류수거분류적정학솔.