西南交通大学学报
西南交通大學學報
서남교통대학학보
JOURNAL OF SOUTHWEST JIAOTONG UNIVERSITY
2005年
1期
44-48
,共5页
数据挖掘%决策树%事后剪枝%PEP%MEP%REP%CCP
數據挖掘%決策樹%事後剪枝%PEP%MEP%REP%CCP
수거알굴%결책수%사후전지%PEP%MEP%REP%CCP
为在决策树剪枝中正确选择剪枝方法,基于理论分析和算例详细地比较了当前主要的4种剪枝方法的计算复杂性、剪枝方式、误差估计和理论基础.与PEP相比,MEP产生的树精度较小且树较大;REP是最简单的剪枝方法之一,但需要独立剪枝集;在同样精度情况下,CCP比REP产生的树小.如果训练数据集丰富,可以选择REP,如果训练数据集较少且剪枝精度要求较高,则可以选用PEP.
為在決策樹剪枝中正確選擇剪枝方法,基于理論分析和算例詳細地比較瞭噹前主要的4種剪枝方法的計算複雜性、剪枝方式、誤差估計和理論基礎.與PEP相比,MEP產生的樹精度較小且樹較大;REP是最簡單的剪枝方法之一,但需要獨立剪枝集;在同樣精度情況下,CCP比REP產生的樹小.如果訓練數據集豐富,可以選擇REP,如果訓練數據集較少且剪枝精度要求較高,則可以選用PEP.
위재결책수전지중정학선택전지방법,기우이론분석화산례상세지비교료당전주요적4충전지방법적계산복잡성、전지방식、오차고계화이론기출.여PEP상비,MEP산생적수정도교소차수교대;REP시최간단적전지방법지일,단수요독립전지집;재동양정도정황하,CCP비REP산생적수소.여과훈련수거집봉부,가이선택REP,여과훈련수거집교소차전지정도요구교고,칙가이선용PEP.