厦门大学学报(自然科学版)
廈門大學學報(自然科學版)
하문대학학보(자연과학판)
JOURNAL OF XIAMEN UNIVERSITY (NATURAL SCIENCE)
2012年
4期
682-685
,共4页
朴素贝叶斯文本分类器%加权朴素贝叶斯文本分类算法%TF-IDF权重%特征项间的相关度
樸素貝葉斯文本分類器%加權樸素貝葉斯文本分類算法%TF-IDF權重%特徵項間的相關度
박소패협사문본분류기%가권박소패협사문본분류산법%TF-IDF권중%특정항간적상관도
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高.
樸素貝葉斯分類算法的特徵項間彊獨立性的假設在現實中是很難滿足的.為瞭在一定程度上放鬆這一假設,提齣瞭基于特徵相關的改進加權樸素貝葉斯分類算法,該算法採用一種新的權重計算方法,這種權重計算方法是在傳統詞頻反文檔頻率(TF-IDF)權重計算基礎上,攷慮到特徵項在類內和類間的分佈情況,另外還結閤特徵項間的相關度,調整權重計算值,加大最能代錶所屬類的特徵項的權重,將它稱之為TF-IDF-FC權重計算.與基于傳統TF-IDF權重的加權樸素貝葉斯分類算法和其他常用加權樸素貝葉斯分類算法比較,如基于屬性加權的樸素貝葉斯分類算法,這種算法的分類效果均有一定的提高.
박소패협사분류산법적특정항간강독립성적가설재현실중시흔난만족적.위료재일정정도상방송저일가설,제출료기우특정상관적개진가권박소패협사분류산법,해산법채용일충신적권중계산방법,저충권중계산방법시재전통사빈반문당빈솔(TF-IDF)권중계산기출상,고필도특정항재류내화류간적분포정황,령외환결합특정항간적상관도,조정권중계산치,가대최능대표소속류적특정항적권중,장타칭지위TF-IDF-FC권중계산.여기우전통TF-IDF권중적가권박소패협사분류산법화기타상용가권박소패협사분류산법비교,여기우속성가권적박소패협사분류산법,저충산법적분류효과균유일정적제고.