计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
13期
139-141,150
,共4页
属性相关性%属性约束%剪枝策略%离散化%Chi2算法
屬性相關性%屬性約束%剪枝策略%離散化%Chi2算法
속성상관성%속성약속%전지책략%리산화%Chi2산법
针对决策树C4.5/5.0分类算法及改进的算法在创建决策树时训练误差率和校验误差率相对较高的缺点,提出一些改进策略,即利用属性相关性进行属性约简与度量以达到解决属性集合中的冗余属性,采用一定置信度值进行决策树的修剪,采用优化的Chi2算法更合理更准确地对连续属性进行离散化,基于改进策略设计并实现一个分类器,将改进的算法应用于Breast-cancer实例,实验结果证明改进的算法生成的决策树具有较高的分类正确率.
針對決策樹C4.5/5.0分類算法及改進的算法在創建決策樹時訓練誤差率和校驗誤差率相對較高的缺點,提齣一些改進策略,即利用屬性相關性進行屬性約簡與度量以達到解決屬性集閤中的冗餘屬性,採用一定置信度值進行決策樹的脩剪,採用優化的Chi2算法更閤理更準確地對連續屬性進行離散化,基于改進策略設計併實現一箇分類器,將改進的算法應用于Breast-cancer實例,實驗結果證明改進的算法生成的決策樹具有較高的分類正確率.
침대결책수C4.5/5.0분류산법급개진적산법재창건결책수시훈련오차솔화교험오차솔상대교고적결점,제출일사개진책략,즉이용속성상관성진행속성약간여도량이체도해결속성집합중적용여속성,채용일정치신도치진행결책수적수전,채용우화적Chi2산법경합리경준학지대련속속성진행리산화,기우개진책략설계병실현일개분류기,장개진적산법응용우Breast-cancer실례,실험결과증명개진적산법생성적결책수구유교고적분류정학솔.