计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2008年
5期
70-72
,共3页
决策树%分裂属性%卡方检验%信息熵
決策樹%分裂屬性%卡方檢驗%信息熵
결책수%분렬속성%잡방검험%신식적
分类问题是数据挖掘和机器学习中的一个核心问题.为了得到最大程度的分类准确率,决策树分类过程中,非常关键的是结点分裂属性的选择.常见的分裂结点属性选择方法可以分为信息熵方法、GINI系数方法等.分析了目前常见的选择分裂属性方法--基于信息熵方法的优、缺点,提出了基于卡方检验的决策树分裂属性的选择方法,用真实例子和设置模拟实验说明了文中算法的优越性.实验结果显示文中算法在分类错误率方面好于以信息熵为基础的方法.
分類問題是數據挖掘和機器學習中的一箇覈心問題.為瞭得到最大程度的分類準確率,決策樹分類過程中,非常關鍵的是結點分裂屬性的選擇.常見的分裂結點屬性選擇方法可以分為信息熵方法、GINI繫數方法等.分析瞭目前常見的選擇分裂屬性方法--基于信息熵方法的優、缺點,提齣瞭基于卡方檢驗的決策樹分裂屬性的選擇方法,用真實例子和設置模擬實驗說明瞭文中算法的優越性.實驗結果顯示文中算法在分類錯誤率方麵好于以信息熵為基礎的方法.
분류문제시수거알굴화궤기학습중적일개핵심문제.위료득도최대정도적분류준학솔,결책수분류과정중,비상관건적시결점분렬속성적선택.상견적분렬결점속성선택방법가이분위신식적방법、GINI계수방법등.분석료목전상견적선택분렬속성방법--기우신식적방법적우、결점,제출료기우잡방검험적결책수분렬속성적선택방법,용진실례자화설치모의실험설명료문중산법적우월성.실험결과현시문중산법재분류착오솔방면호우이신식적위기출적방법.