数据采集与处理
數據採集與處理
수거채집여처리
JOURNAL OF DATA ACQUISITION & PROCESSING
2014年
1期
71-75
,共5页
文本分类%朴素贝叶斯%先验概率%后验概率
文本分類%樸素貝葉斯%先驗概率%後驗概率
문본분류%박소패협사%선험개솔%후험개솔
text categorization%naive Bayes%prior probability%posterior probability
针对在文本分类中先验概率的计算比较费时而且对分类效果影响不大、后验概率的精度损失影响分类准确率的现象,对经典朴素贝叶斯分类算法进行了改进,提出了一种“先抑后扬”(抑制先验概率的作用,扩大后验概率的影响)的文本分类算法.算法中去掉了对先验概率的计算,并在后验概率的计算中引入了一个放大系数.实验结果表明,分类时不计算先验概率对分类精度影响甚微但可以明显加快分类的速度,在后验概率的计算中引入放大系数减少了误差传播的影响,提高了分类精度.
針對在文本分類中先驗概率的計算比較費時而且對分類效果影響不大、後驗概率的精度損失影響分類準確率的現象,對經典樸素貝葉斯分類算法進行瞭改進,提齣瞭一種“先抑後颺”(抑製先驗概率的作用,擴大後驗概率的影響)的文本分類算法.算法中去掉瞭對先驗概率的計算,併在後驗概率的計算中引入瞭一箇放大繫數.實驗結果錶明,分類時不計算先驗概率對分類精度影響甚微但可以明顯加快分類的速度,在後驗概率的計算中引入放大繫數減少瞭誤差傳播的影響,提高瞭分類精度.
침대재문본분류중선험개솔적계산비교비시이차대분류효과영향불대、후험개솔적정도손실영향분류준학솔적현상,대경전박소패협사분류산법진행료개진,제출료일충“선억후양”(억제선험개솔적작용,확대후험개솔적영향)적문본분류산법.산법중거도료대선험개솔적계산,병재후험개솔적계산중인입료일개방대계수.실험결과표명,분류시불계산선험개솔대분류정도영향심미단가이명현가쾌분류적속도,재후험개솔적계산중인입방대계수감소료오차전파적영향,제고료분류정도.