计算机工程与科学
計算機工程與科學
계산궤공정여과학
Computer Engineering and Science
2015年
9期
1783-1793
,共11页
ID3算法%相关系数%决策树%泰勒公式%信息增益
ID3算法%相關繫數%決策樹%泰勒公式%信息增益
ID3산법%상관계수%결책수%태륵공식%신식증익
ID3 algorithm%correlation coefficient%decision tree%Taylor formula%information gain
通过分析ID3算法的基本原理及其多值偏向问题,提出了一种基于相关系数的决策树优化算法.首先通过引进相关系数对ID3算法进行改进,从而克服其多值偏向问题,然后运用数学中泰勒公式和麦克劳林公式的性质,对信息增益公式进行近似简化.通过具体数据的实例验证,说明优化后的ID3算法能够解决多值偏向问题.标准数据集UCI上的实验结果表明,在构建决策树的过程中,既提高了平均分类准确率,又降低了构建决策树的复杂度,从而还缩短了决策树的生成时间,当数据集中的样本数较大时,优化后的ID3算法的效率得到了明显的提高.
通過分析ID3算法的基本原理及其多值偏嚮問題,提齣瞭一種基于相關繫數的決策樹優化算法.首先通過引進相關繫數對ID3算法進行改進,從而剋服其多值偏嚮問題,然後運用數學中泰勒公式和麥剋勞林公式的性質,對信息增益公式進行近似簡化.通過具體數據的實例驗證,說明優化後的ID3算法能夠解決多值偏嚮問題.標準數據集UCI上的實驗結果錶明,在構建決策樹的過程中,既提高瞭平均分類準確率,又降低瞭構建決策樹的複雜度,從而還縮短瞭決策樹的生成時間,噹數據集中的樣本數較大時,優化後的ID3算法的效率得到瞭明顯的提高.
통과분석ID3산법적기본원리급기다치편향문제,제출료일충기우상관계수적결책수우화산법.수선통과인진상관계수대ID3산법진행개진,종이극복기다치편향문제,연후운용수학중태륵공식화맥극로림공식적성질,대신식증익공식진행근사간화.통과구체수거적실례험증,설명우화후적ID3산법능구해결다치편향문제.표준수거집UCI상적실험결과표명,재구건결책수적과정중,기제고료평균분류준학솔,우강저료구건결책수적복잡도,종이환축단료결책수적생성시간,당수거집중적양본수교대시,우화후적ID3산법적효솔득도료명현적제고.