漳州师范学院学报(自然科学版)
漳州師範學院學報(自然科學版)
장주사범학원학보(자연과학판)
JOURNAL OF ZHANGZHOU TEACHERS COLLEGE(NATURAL SCIENCE EDITION)
2012年
4期
15-18
,共4页
数据挖掘%分类%决策树%虚根节点
數據挖掘%分類%決策樹%虛根節點
수거알굴%분류%결책수%허근절점
Data Mining%Classification%ID3%Virtual Root
与其他分类技术相比较,ID3算法具有耗时少、速度快特点.然而,ID3算法分类规则少、无匹配率高,从而导致其分类准确率不高,尤其在小数据集上表现更为明显.针对ID3上述缺点,我们提出了一个改进ID3算法 VRID3:首先,VRID3创建一个虚根节点,然后找出两个“最好”属性生成虚根节点的两棵子树,从而提高测试实例的匹配率;其次,测试实例时,优先使用第一子树判断实例,如果第一子树没有匹配到,则使用第二子树判断该实例.实验结果表明,基于虚根节点的ID3算法具有更高的准确率.
與其他分類技術相比較,ID3算法具有耗時少、速度快特點.然而,ID3算法分類規則少、無匹配率高,從而導緻其分類準確率不高,尤其在小數據集上錶現更為明顯.針對ID3上述缺點,我們提齣瞭一箇改進ID3算法 VRID3:首先,VRID3創建一箇虛根節點,然後找齣兩箇“最好”屬性生成虛根節點的兩棵子樹,從而提高測試實例的匹配率;其次,測試實例時,優先使用第一子樹判斷實例,如果第一子樹沒有匹配到,則使用第二子樹判斷該實例.實驗結果錶明,基于虛根節點的ID3算法具有更高的準確率.
여기타분류기술상비교,ID3산법구유모시소、속도쾌특점.연이,ID3산법분류규칙소、무필배솔고,종이도치기분류준학솔불고,우기재소수거집상표현경위명현.침대ID3상술결점,아문제출료일개개진ID3산법 VRID3:수선,VRID3창건일개허근절점,연후조출량개“최호”속성생성허근절점적량과자수,종이제고측시실례적필배솔;기차,측시실례시,우선사용제일자수판단실례,여과제일자수몰유필배도,칙사용제이자수판단해실례.실험결과표명,기우허근절점적ID3산법구유경고적준학솔.
In comparison with other classification, ID3 algorithm is considerably faster. However, Generating less classification rules, ID3 algorithm’s accuracy may be very low,especially in small data sets. In this paper, we improve ID3 based on virtual root(VRID3). First, VRID3 builds a virtual root node,and selects the best two attributes to build tow sub-trees of the root. Second, given a new instance, which is matched by the first sub-tree, if not match, then it is matched by the second sub-tree. Experimental results show that the method is highly accuracy in comparison with the ID3 algorithm.