计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2012年
12期
4726-4730
,共5页
文本分类%贝叶斯%卡方%加权%文档频率%特征选择
文本分類%貝葉斯%卡方%加權%文檔頻率%特徵選擇
문본분류%패협사%잡방%가권%문당빈솔%특정선택
为提高朴素贝叶斯分类器的分类性能,考虑决策分类过程中条件属性的不同重要程度,提出了一种基于特征选择权重的贝叶斯分类算法.采用卡方值和文档频数相结合的数值来表示特征词的重要程度,对该值进行处理获得每个特征词权重,建立加权贝叶斯分类器.在研究维文特点的基础上,利用该算法构建了一个维文文本分类模型.在搜集到的维文语料库上进行的实验结果表明,该算法比朴素贝叶斯拥有更好的分类性能.
為提高樸素貝葉斯分類器的分類性能,攷慮決策分類過程中條件屬性的不同重要程度,提齣瞭一種基于特徵選擇權重的貝葉斯分類算法.採用卡方值和文檔頻數相結閤的數值來錶示特徵詞的重要程度,對該值進行處理穫得每箇特徵詞權重,建立加權貝葉斯分類器.在研究維文特點的基礎上,利用該算法構建瞭一箇維文文本分類模型.在搜集到的維文語料庫上進行的實驗結果錶明,該算法比樸素貝葉斯擁有更好的分類性能.
위제고박소패협사분류기적분류성능,고필결책분류과정중조건속성적불동중요정도,제출료일충기우특정선택권중적패협사분류산법.채용잡방치화문당빈수상결합적수치래표시특정사적중요정도,대해치진행처리획득매개특정사권중,건립가권패협사분류기.재연구유문특점적기출상,이용해산법구건료일개유문문본분류모형.재수집도적유문어료고상진행적실험결과표명,해산법비박소패협사옹유경호적분류성능.