兰州理工大学学报
蘭州理工大學學報
란주리공대학학보
JOURNAL OF LANZHOU UNIVERSITY OF TECHNOLOGY
2013年
4期
99-104
,共6页
王东%熊世桓%向程冠%靳宁
王東%熊世桓%嚮程冠%靳寧
왕동%웅세환%향정관%근저
文本分类%朴素贝叶斯分类器%关联规则%项集%频繁项集
文本分類%樸素貝葉斯分類器%關聯規則%項集%頻繁項集
문본분류%박소패협사분류기%관련규칙%항집%빈번항집
text categorization%Naive Bayes classifier%association rule%itemsets%frequent itemsets
针对NB分类方法中过于严格的独立性假设,应用频繁2-项集为分类测度,通过放宽独立性假设达到改善分类性能的目的.在训练阶段使用类似Apriori关联规则发现算法挖掘并建立频繁2-项集库,当测试新文档时,文档特征通过竞争搭配生成基于测试文档的频繁2-项集序列,优先选择类词频率和置信度综合评分最高的频繁2-项集进入概率估算过程,并用频繁2-项集的综合评分置换NB的单项特征概率估计.在不同数据集的实验中显示,基于频繁2-项集的贝叶斯分类器(TIB)的分类精度整体上好于NB分类器,是一种有效的分类方法.
針對NB分類方法中過于嚴格的獨立性假設,應用頻繁2-項集為分類測度,通過放寬獨立性假設達到改善分類性能的目的.在訓練階段使用類似Apriori關聯規則髮現算法挖掘併建立頻繁2-項集庫,噹測試新文檔時,文檔特徵通過競爭搭配生成基于測試文檔的頻繁2-項集序列,優先選擇類詞頻率和置信度綜閤評分最高的頻繁2-項集進入概率估算過程,併用頻繁2-項集的綜閤評分置換NB的單項特徵概率估計.在不同數據集的實驗中顯示,基于頻繁2-項集的貝葉斯分類器(TIB)的分類精度整體上好于NB分類器,是一種有效的分類方法.
침대NB분류방법중과우엄격적독립성가설,응용빈번2-항집위분류측도,통과방관독립성가설체도개선분류성능적목적.재훈련계단사용유사Apriori관련규칙발현산법알굴병건립빈번2-항집고,당측시신문당시,문당특정통과경쟁탑배생성기우측시문당적빈번2-항집서렬,우선선택류사빈솔화치신도종합평분최고적빈번2-항집진입개솔고산과정,병용빈번2-항집적종합평분치환NB적단항특정개솔고계.재불동수거집적실험중현시,기우빈번2-항집적패협사분류기(TIB)적분류정도정체상호우NB분류기,시일충유효적분류방법.