计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2012年
11期
183-186
,共4页
相容粗糙集%决策树%扩展属性%割点%统计分析
相容粗糙集%決策樹%擴展屬性%割點%統計分析
상용조조집%결책수%확전속성%할점%통계분석
决策树是常用的数据挖掘方法,扩展属性的选择是决策树归纳的核心问题.基于离散化方法的连续值决策树归纳在选择扩展属性时,需要度量每一个条件属性的每一个割点的分类不确定性,并通过这些割点的不确定性选择扩展属性,其计算时间复杂度高.针对这一问题,提出了一种基于相容粗糙集技术的连续值属性决策树归纳方法.该方法首先利用相容粗糙集技术选择扩展属性,然后找出该属性的最优割点,分割样例集并递归地构建决策树.从理论上分析了该算法的计算时间复杂度,并在多个数据集上进行了实验.实验结果及对实验结果的统计分析均表明,提出的方法在计算复杂度和分类精度方面均优于其他相关方法.
決策樹是常用的數據挖掘方法,擴展屬性的選擇是決策樹歸納的覈心問題.基于離散化方法的連續值決策樹歸納在選擇擴展屬性時,需要度量每一箇條件屬性的每一箇割點的分類不確定性,併通過這些割點的不確定性選擇擴展屬性,其計算時間複雜度高.針對這一問題,提齣瞭一種基于相容粗糙集技術的連續值屬性決策樹歸納方法.該方法首先利用相容粗糙集技術選擇擴展屬性,然後找齣該屬性的最優割點,分割樣例集併遞歸地構建決策樹.從理論上分析瞭該算法的計算時間複雜度,併在多箇數據集上進行瞭實驗.實驗結果及對實驗結果的統計分析均錶明,提齣的方法在計算複雜度和分類精度方麵均優于其他相關方法.
결책수시상용적수거알굴방법,확전속성적선택시결책수귀납적핵심문제.기우리산화방법적련속치결책수귀납재선택확전속성시,수요도량매일개조건속성적매일개할점적분류불학정성,병통과저사할점적불학정성선택확전속성,기계산시간복잡도고.침대저일문제,제출료일충기우상용조조집기술적련속치속성결책수귀납방법.해방법수선이용상용조조집기술선택확전속성,연후조출해속성적최우할점,분할양례집병체귀지구건결책수.종이론상분석료해산법적계산시간복잡도,병재다개수거집상진행료실험.실험결과급대실험결과적통계분석균표명,제출적방법재계산복잡도화분류정도방면균우우기타상관방법.