计算机工程与应用
計算機工程與應用
계산궤공정여응용
Computer Engineering and Applications
2015年
23期
149-154
,共6页
旋转森林%分类器集成%主成分分析%决策树
鏇轉森林%分類器集成%主成分分析%決策樹
선전삼림%분류기집성%주성분분석%결책수
rotation forest%classifier ensemble%principal components analysis%decision tree
为提高决策树的集成分类精度,介绍了一种基于特征变换的旋转森林分类器集成算法,通过对数据属性集的随机分割,并在属性子集上对抽取的子样本数据进行主成分分析,以构造新的样本数据,达到增大基分类器差异性及提高预测准确率的目的.在Weka平台下,分别采用Bagging、 AdaBoost及旋转森林算法对剪枝与未剪枝的J48决策树分类算法进行集成的对比试验,以10次10折交叉验证的平均准确率为比较依据.结果表明旋转森林算法的预测精度优于其他两个算法,验证了旋转森林是一种有效的决策树分类器集成算法.
為提高決策樹的集成分類精度,介紹瞭一種基于特徵變換的鏇轉森林分類器集成算法,通過對數據屬性集的隨機分割,併在屬性子集上對抽取的子樣本數據進行主成分分析,以構造新的樣本數據,達到增大基分類器差異性及提高預測準確率的目的.在Weka平檯下,分彆採用Bagging、 AdaBoost及鏇轉森林算法對剪枝與未剪枝的J48決策樹分類算法進行集成的對比試驗,以10次10摺交扠驗證的平均準確率為比較依據.結果錶明鏇轉森林算法的預測精度優于其他兩箇算法,驗證瞭鏇轉森林是一種有效的決策樹分類器集成算法.
위제고결책수적집성분류정도,개소료일충기우특정변환적선전삼림분류기집성산법,통과대수거속성집적수궤분할,병재속성자집상대추취적자양본수거진행주성분분석,이구조신적양본수거,체도증대기분류기차이성급제고예측준학솔적목적.재Weka평태하,분별채용Bagging、 AdaBoost급선전삼림산법대전지여미전지적J48결책수분류산법진행집성적대비시험,이10차10절교차험증적평균준학솔위비교의거.결과표명선전삼림산법적예측정도우우기타량개산법,험증료선전삼림시일충유효적결책수분류기집성산법.