江西理工大学学报
江西理工大學學報
강서리공대학학보
Journal of Jiangxi University of Science and Technology
2015年
5期
90-97
,共8页
ID3算法%多值偏向%权衡因子%决策树%权重
ID3算法%多值偏嚮%權衡因子%決策樹%權重
ID3산법%다치편향%권형인자%결책수%권중
ID3 algorithm%multivalue bias%weighting factor%decision tree%weight
通过分析ID3算法的多值偏向问题和传统ID3改进算法中出现的主观性等问题,提出了一种基于权衡因子的决策树优化算法. 该优化算法通过引入能够反映属性之间相互依赖关系的权衡因子,对取值个数最多的属性的划分权重重新进行权衡,以完成对ID3算法的改进. 实例验证和标准数据集UCI上的实验结果表明,当数据集中属性的取值个数不相同时,优化后的ID3算法能够解决多值偏向问题, 在构建决策树的过程中, 优化后的ID3算法既能提高平均分类准确率,又能减少平均叶子节点数.
通過分析ID3算法的多值偏嚮問題和傳統ID3改進算法中齣現的主觀性等問題,提齣瞭一種基于權衡因子的決策樹優化算法. 該優化算法通過引入能夠反映屬性之間相互依賴關繫的權衡因子,對取值箇數最多的屬性的劃分權重重新進行權衡,以完成對ID3算法的改進. 實例驗證和標準數據集UCI上的實驗結果錶明,噹數據集中屬性的取值箇數不相同時,優化後的ID3算法能夠解決多值偏嚮問題, 在構建決策樹的過程中, 優化後的ID3算法既能提高平均分類準確率,又能減少平均葉子節點數.
통과분석ID3산법적다치편향문제화전통ID3개진산법중출현적주관성등문제,제출료일충기우권형인자적결책수우화산법. 해우화산법통과인입능구반영속성지간상호의뢰관계적권형인자,대취치개수최다적속성적화분권중중신진행권형,이완성대ID3산법적개진. 실례험증화표준수거집UCI상적실험결과표명,당수거집중속성적취치개수불상동시,우화후적ID3산법능구해결다치편향문제, 재구건결책수적과정중, 우화후적ID3산법기능제고평균분류준학솔,우능감소평균협자절점수.
Through the analysis of the issues of multivalue bias in the ID3 algorithm and subjectivity of the optimized traditional ID3 algorithm, an improved algorithm of decision tree based on weighting factor is put forward. The new algorithm introduces the weight factor that reflects the mutual relationship between the attributes. The ID3 algorithm is improved by redistricting the weight of attributes which has most values. The experiments on UCI data sets show that the optimization ID3 algorithm can overcome multivalue bias when the values of different attributes in data set are not the same. This algorithm not only improves the accuracy of average classification, but also reduces the number of average leaf nodes in the process of constructing a decision tree.