计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2007年
10期
50-53
,共4页
决策树%组间平方和%组内平方和增益率
決策樹%組間平方和%組內平方和增益率
결책수%조간평방화%조내평방화증익솔
测试属性的选择是决策树构建的关键.本文基于单因素方差分析原理,提出了决策树算法ANOVA1.0及ANOVA2.0.两种算法在测试属性的选择上分别采用最大组间平方和、最大组内平方和增益率,而且都在平台WEKA-3-5上实现.与ID3、C4.5进行效率、精度等方面比较的大数据集实验结果表明,提出的两种算法是较好的分类算法.
測試屬性的選擇是決策樹構建的關鍵.本文基于單因素方差分析原理,提齣瞭決策樹算法ANOVA1.0及ANOVA2.0.兩種算法在測試屬性的選擇上分彆採用最大組間平方和、最大組內平方和增益率,而且都在平檯WEKA-3-5上實現.與ID3、C4.5進行效率、精度等方麵比較的大數據集實驗結果錶明,提齣的兩種算法是較好的分類算法.
측시속성적선택시결책수구건적관건.본문기우단인소방차분석원리,제출료결책수산법ANOVA1.0급ANOVA2.0.량충산법재측시속성적선택상분별채용최대조간평방화、최대조내평방화증익솔,이차도재평태WEKA-3-5상실현.여ID3、C4.5진행효솔、정도등방면비교적대수거집실험결과표명,제출적량충산법시교호적분류산법.