计算机与应用化学
計算機與應用化學
계산궤여응용화학
COMPUTERS AND APPLIED CHEMISTRY
2010年
4期
425-429
,共5页
信息粒%模糊转换%分类%非平衡数据集
信息粒%模糊轉換%分類%非平衡數據集
신식립%모호전환%분류%비평형수거집
化学样本数据常为非平衡,用传统方法分析这些数据集时,对于需特别关注的少数类数据,识别能力往往较差.因此,提出建立基于粒计算的分类规则模型(GCCRM),先用改进的自适应共振网络ETM-ART2将性质相近的个体聚合为信息粒,降低样本容量和问题规模,同时又保持较高的纯度;然后将信息粒的属性特征模糊离散化,简化它;最后经关联规则挖掘,得可预测样本的分类规则模型.用于识别玻璃,结果GCCRM能剔除冗余信息,加强关键特征,所提取的分类规则预测正确率高,尤适用于非平衡数据集,其性能比C4.5决策树、支持向量机SVM等算法优良.
化學樣本數據常為非平衡,用傳統方法分析這些數據集時,對于需特彆關註的少數類數據,識彆能力往往較差.因此,提齣建立基于粒計算的分類規則模型(GCCRM),先用改進的自適應共振網絡ETM-ART2將性質相近的箇體聚閤為信息粒,降低樣本容量和問題規模,同時又保持較高的純度;然後將信息粒的屬性特徵模糊離散化,簡化它;最後經關聯規則挖掘,得可預測樣本的分類規則模型.用于識彆玻璃,結果GCCRM能剔除冗餘信息,加彊關鍵特徵,所提取的分類規則預測正確率高,尤適用于非平衡數據集,其性能比C4.5決策樹、支持嚮量機SVM等算法優良.
화학양본수거상위비평형,용전통방법분석저사수거집시,대우수특별관주적소수류수거,식별능력왕왕교차.인차,제출건립기우립계산적분류규칙모형(GCCRM),선용개진적자괄응공진망락ETM-ART2장성질상근적개체취합위신식립,강저양본용량화문제규모,동시우보지교고적순도;연후장신식립적속성특정모호리산화,간화타;최후경관련규칙알굴,득가예측양본적분류규칙모형.용우식별파리,결과GCCRM능척제용여신식,가강관건특정,소제취적분류규칙예측정학솔고,우괄용우비평형수거집,기성능비C4.5결책수、지지향량궤SVM등산법우량.