软件
軟件
연건
SOFT WARE
2013年
2期
61-64
,共4页
数据挖掘%优化策略%C4.5算法%平衡度系数
數據挖掘%優化策略%C4.5算法%平衡度繫數
수거알굴%우화책략%C4.5산법%평형도계수
传统C4.5算法思想计算量大,在明确的先验知识情况下不能建立更优的决策树,影响了决策树生成时间及结构.根据数学上等价无穷小性质减少信息增益率的计算量,采用全局优化策略弥补简化所引起的误差,进而提高计算效率.在优化中考虑先验知识的特殊情况引入平衡度系数,实现C4.5算法的优化分枝策略,建立更符合实际情况的决策树.实验证明,优化的方案与C4.5算法相比决策树具有大致相同的分类准确率和更高的生成速度.
傳統C4.5算法思想計算量大,在明確的先驗知識情況下不能建立更優的決策樹,影響瞭決策樹生成時間及結構.根據數學上等價無窮小性質減少信息增益率的計算量,採用全跼優化策略瀰補簡化所引起的誤差,進而提高計算效率.在優化中攷慮先驗知識的特殊情況引入平衡度繫數,實現C4.5算法的優化分枝策略,建立更符閤實際情況的決策樹.實驗證明,優化的方案與C4.5算法相比決策樹具有大緻相同的分類準確率和更高的生成速度.
전통C4.5산법사상계산량대,재명학적선험지식정황하불능건립경우적결책수,영향료결책수생성시간급결구.근거수학상등개무궁소성질감소신식증익솔적계산량,채용전국우화책략미보간화소인기적오차,진이제고계산효솔.재우화중고필선험지식적특수정황인입평형도계수,실현C4.5산법적우화분지책략,건립경부합실제정황적결책수.실험증명,우화적방안여C4.5산법상비결책수구유대치상동적분류준학솔화경고적생성속도.