计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2007年
15期
190-192
,共3页
白莉媛%黄晖%刘素华%阎秋玲
白莉媛%黃暉%劉素華%閻鞦玲
백리원%황휘%류소화%염추령
分布聚类%文本分类%朴素贝叶斯分类器%自助平均
分佈聚類%文本分類%樸素貝葉斯分類器%自助平均
분포취류%문본분류%박소패협사분류기%자조평균
针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题,在概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对序列构造规模相当的样本集,并将估计出的参数的平均值作为训练得到的参数对未知文本进行分类.公共文本实验数据集上的实验结果表明,该文提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单.
針對單詞簇上訓練樸素貝葉斯文本分類器概率估計偏差較大所導緻的分類精度較低問題,在概率分佈聚類算法得到的單詞簇的基礎上,根據單詞與簇間互信息建立有序單詞子序列,採用有放迴隨機抽樣對序列構造規模相噹的樣本集,併將估計齣的參數的平均值作為訓練得到的參數對未知文本進行分類.公共文本實驗數據集上的實驗結果錶明,該文提齣的訓練方法相對于傳統的樸素貝葉斯分類器訓練方法能夠穫得更高的分類精度且過程相對簡單.
침대단사족상훈련박소패협사문본분류기개솔고계편차교대소도치적분류정도교저문제,재개솔분포취류산법득도적단사족적기출상,근거단사여족간호신식건립유서단사자서렬,채용유방회수궤추양대서렬구조규모상당적양본집,병장고계출적삼수적평균치작위훈련득도적삼수대미지문본진행분류.공공문본실험수거집상적실험결과표명,해문제출적훈련방법상대우전통적박소패협사분류기훈련방법능구획득경고적분류정도차과정상대간단.