中国科技信息
中國科技信息
중국과기신식
CHINA SCIENCE AND TECHNOLOGY INFORMATION
2007年
13期
268-269
,共2页
ID3算法%多值偏向性%属性趋近度
ID3算法%多值偏嚮性%屬性趨近度
ID3산법%다치편향성%속성추근도
ID3决策树算法是数据挖掘中最常用的一种方法,但其存在多值偏向性等问题,文中根据相似性原理,引进属性趋近度概念,以描述属性和决策分类属性的分类样本数的趋近程度确定测试属性,构建决策树,并对ID3算法和改进算法T_ID3算法的多值偏向性问题和测试预测率进行了理论和实验的验证.
ID3決策樹算法是數據挖掘中最常用的一種方法,但其存在多值偏嚮性等問題,文中根據相似性原理,引進屬性趨近度概唸,以描述屬性和決策分類屬性的分類樣本數的趨近程度確定測試屬性,構建決策樹,併對ID3算法和改進算法T_ID3算法的多值偏嚮性問題和測試預測率進行瞭理論和實驗的驗證.
ID3결책수산법시수거알굴중최상용적일충방법,단기존재다치편향성등문제,문중근거상사성원리,인진속성추근도개념,이묘술속성화결책분류속성적분류양본수적추근정도학정측시속성,구건결책수,병대ID3산법화개진산법T_ID3산법적다치편향성문제화측시예측솔진행료이론화실험적험증.