河南科学
河南科學
하남과학
HENAN SCIENCE
2014年
1期
42-46
,共5页
朴素贝叶斯%属性相关%信息熵%信息增益
樸素貝葉斯%屬性相關%信息熵%信息增益
박소패협사%속성상관%신식적%신식증익
naive Bayes%attribute correlation%information entropy%information gain
朴素贝叶斯分类器是一种简单、高效的分类算法,它以贝叶斯定理和最大后验假设为理论基础,然而朴素贝叶斯分类器属性之间相互独立的假设,影响了朴素贝叶斯分类器的性能。提出先使用基于相关的属性选择算法进行属性选择,然后在选择的属性集上,用朴素贝叶斯分类器对数据集进行分类。实验证明,与未使用属性选择的实验结果相比,使用基于相关的属性选择算法进行属性选择后,朴素贝叶斯分类器平均分类正确率提高,分类效率显著提升。
樸素貝葉斯分類器是一種簡單、高效的分類算法,它以貝葉斯定理和最大後驗假設為理論基礎,然而樸素貝葉斯分類器屬性之間相互獨立的假設,影響瞭樸素貝葉斯分類器的性能。提齣先使用基于相關的屬性選擇算法進行屬性選擇,然後在選擇的屬性集上,用樸素貝葉斯分類器對數據集進行分類。實驗證明,與未使用屬性選擇的實驗結果相比,使用基于相關的屬性選擇算法進行屬性選擇後,樸素貝葉斯分類器平均分類正確率提高,分類效率顯著提升。
박소패협사분류기시일충간단、고효적분류산법,타이패협사정리화최대후험가설위이론기출,연이박소패협사분류기속성지간상호독립적가설,영향료박소패협사분류기적성능。제출선사용기우상관적속성선택산법진행속성선택,연후재선택적속성집상,용박소패협사분류기대수거집진행분류。실험증명,여미사용속성선택적실험결과상비,사용기우상관적속성선택산법진행속성선택후,박소패협사분류기평균분류정학솔제고,분류효솔현저제승。
Naive Bayes classifier is a simple and effective classification method. Its theory foundation is Bayesian and maximum posteriori assumptions. But independence assumption of properties affects the performance of the Naive Bayes classifier. This paper presents a way to improve the performance of the Naive Bayes classifier. It selects attribute set from all attributes of the data sets by correlation-base feature selecting algornthin and classifies the data sets by Naive Bayes classifier. Experimental results show that the average correct classification rate increases and the efficiency of classification significantly improves compared with the unused attribute selection.