计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
25期
146-148,154
,共4页
决策树%模糊集%模糊增益比例%聚类
決策樹%模糊集%模糊增益比例%聚類
결책수%모호집%모호증익비례%취류
节点属性的选择是决策树生成过程中的关键环节,以ID3和c4.5为代表的经典决策树算法中,树节点的选择是通过子集样本数计算信息增益或增益比例得到的.但是,对于连续性属性,由于离散化分割导致了子集边界元素在隶属关系上的模糊,使样本计算的方式存在了一定的不合理性,为解决这一问题,采用了模糊集理论并以模糊度的方式取代样本个数参与增益比例的计算,给出了一种获得决策树分类中不确定性尺度的可行途径.
節點屬性的選擇是決策樹生成過程中的關鍵環節,以ID3和c4.5為代錶的經典決策樹算法中,樹節點的選擇是通過子集樣本數計算信息增益或增益比例得到的.但是,對于連續性屬性,由于離散化分割導緻瞭子集邊界元素在隸屬關繫上的模糊,使樣本計算的方式存在瞭一定的不閤理性,為解決這一問題,採用瞭模糊集理論併以模糊度的方式取代樣本箇數參與增益比例的計算,給齣瞭一種穫得決策樹分類中不確定性呎度的可行途徑.
절점속성적선택시결책수생성과정중적관건배절,이ID3화c4.5위대표적경전결책수산법중,수절점적선택시통과자집양본수계산신식증익혹증익비례득도적.단시,대우련속성속성,유우리산화분할도치료자집변계원소재대속관계상적모호,사양본계산적방식존재료일정적불합이성,위해결저일문제,채용료모호집이론병이모호도적방식취대양본개수삼여증익비례적계산,급출료일충획득결책수분류중불학정성척도적가행도경.