计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2009年
22期
5197-5199,5203
,共4页
巩固%吕俊怀%黄永青%郝国生
鞏固%呂俊懷%黃永青%郝國生
공고%려준부%황영청%학국생
决策树%离散化%Chi2算法%分类器%预测精度
決策樹%離散化%Chi2算法%分類器%預測精度
결책수%리산화%Chi2산법%분류기%예측정도
decision tree%diseretization%Chi2 algorithm%classifier%predietive accttracy
处理连续属性离散化是决策树分类方法中C5.0算法在创建决策树时对数据表示空间的简化的一个重要问题,采用合理有效的连续属性离散化方法可以提高创建决策树的分类预测精度.在分析C5.0算法的离散化方法的不足之处后,提出一种改进Chi2算法的方法,能更合理更准确地对连续属性进行离散化,在此基础上创建的决策树具有更好的准确率.实验结果表明,基于改进方法的C5.0算法创建的决策树分类模型具有较高的分类准确率.
處理連續屬性離散化是決策樹分類方法中C5.0算法在創建決策樹時對數據錶示空間的簡化的一箇重要問題,採用閤理有效的連續屬性離散化方法可以提高創建決策樹的分類預測精度.在分析C5.0算法的離散化方法的不足之處後,提齣一種改進Chi2算法的方法,能更閤理更準確地對連續屬性進行離散化,在此基礎上創建的決策樹具有更好的準確率.實驗結果錶明,基于改進方法的C5.0算法創建的決策樹分類模型具有較高的分類準確率.
처리련속속성리산화시결책수분류방법중C5.0산법재창건결책수시대수거표시공간적간화적일개중요문제,채용합리유효적련속속성리산화방법가이제고창건결책수적분류예측정도.재분석C5.0산법적리산화방법적불족지처후,제출일충개진Chi2산법적방법,능경합리경준학지대련속속성진행리산화,재차기출상창건적결책수구유경호적준학솔.실험결과표명,기우개진방법적C5.0산법창건적결책수분류모형구유교고적분류준학솔.
How to discretize continuous attributes is an important problem that simplifies the representation of data set when building a decision tree based on C5.0 algorithm. Adopting a more effective and sound method ofdiscretization can heighten the predictive accuracy of decision tree. To do this, improved method of Chi2 algorithm is presented after studying the C5.0 algorithm and Chi2 algorithm and analyzing their drawbacks of discretization, which discretizes the renl value attributes exactly and reasonably while growing an accurate decision-tree. The experiment results show the validity of the proposed method.