太原科技大学学报
太原科技大學學報
태원과기대학학보
JOURNAL OF TAIYUAN UNIVERSITY OF SCIENCE AND TECHNOLOGY
2005年
3期
199-202
,共4页
数据挖掘%决策树%信息增益%信息熵%属性-值对
數據挖掘%決策樹%信息增益%信息熵%屬性-值對
수거알굴%결책수%신식증익%신식적%속성-치대
偏向于取值较多的属性是ID3算法的一个缺陷,目前已提出的决策树的优化算法对ID3算法的改进,部分解决了该缺陷,但仅适用于两值属性的样例集,对于多值属性效果并不明显.针对该优化算法的不足,通过将属性和属性值对应成一个属性,提出了属性-值对的信息增益优化算法GBT.通过理论和实验分析,表明该算法不仅克服了ID3算法偏向于取值多属性的缺陷,同时解决了优化算法对多值属性效果不明显的不足.
偏嚮于取值較多的屬性是ID3算法的一箇缺陷,目前已提齣的決策樹的優化算法對ID3算法的改進,部分解決瞭該缺陷,但僅適用于兩值屬性的樣例集,對于多值屬性效果併不明顯.針對該優化算法的不足,通過將屬性和屬性值對應成一箇屬性,提齣瞭屬性-值對的信息增益優化算法GBT.通過理論和實驗分析,錶明該算法不僅剋服瞭ID3算法偏嚮于取值多屬性的缺陷,同時解決瞭優化算法對多值屬性效果不明顯的不足.
편향우취치교다적속성시ID3산법적일개결함,목전이제출적결책수적우화산법대ID3산법적개진,부분해결료해결함,단부괄용우량치속성적양례집,대우다치속성효과병불명현.침대해우화산법적불족,통과장속성화속성치대응성일개속성,제출료속성-치대적신식증익우화산법GBT.통과이론화실험분석,표명해산법불부극복료ID3산법편향우취치다속성적결함,동시해결료우화산법대다치속성효과불명현적불족.