计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2010年
8期
127-129
,共3页
数据挖掘%决策树%属性选择
數據挖掘%決策樹%屬性選擇
수거알굴%결책수%속성선택
data mining%decision tree%attributes selection
分析了ID3算法的基本原理、实现步骤及现有两种改进分类算法的优缺点,针对ID3算法的取值偏向问题和现有两种改进算法在分类时间、分类精确度方面存在的不足,提出了一种新的分类属性选择方案,并利用数学知识对其进行了优化.经实验证明,优化后的方案克服了ID3算法的取值偏向问题,同时在分类时间及分类精确度方面优于ID3算法及现有两种改进的分类算法.
分析瞭ID3算法的基本原理、實現步驟及現有兩種改進分類算法的優缺點,針對ID3算法的取值偏嚮問題和現有兩種改進算法在分類時間、分類精確度方麵存在的不足,提齣瞭一種新的分類屬性選擇方案,併利用數學知識對其進行瞭優化.經實驗證明,優化後的方案剋服瞭ID3算法的取值偏嚮問題,同時在分類時間及分類精確度方麵優于ID3算法及現有兩種改進的分類算法.
분석료ID3산법적기본원리、실현보취급현유량충개진분류산법적우결점,침대ID3산법적취치편향문제화현유량충개진산법재분류시간、분류정학도방면존재적불족,제출료일충신적분류속성선택방안,병이용수학지식대기진행료우화.경실험증명,우화후적방안극복료ID3산법적취치편향문제,동시재분류시간급분류정학도방면우우ID3산법급현유량충개진적분류산법.
Analyze the basic principles and implementation steps of ID3 and point out the advantages and disadvantages of two existing improved classification algorithms.With the shortcoming of inclining to choose attributes having many values for ID3 and the deficiencies of classification time and classification accuracy for existing two improved classification algorithms,a new attribute selection scheme is proposed and optimized with mathematical knowledge.Experiment results show that the optimized scheme can overcome the above disadvantage of ID3 and has the advantages of classification time and classification accuracy over the existing two classification algorithms.