计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2012年
10期
2923-2926
,共4页
阿力木江·艾沙%吐尔根·依布拉音%库尔班·吾布力%李哲
阿力木江·艾沙%吐爾根·依佈拉音%庫爾班·吾佈力%李哲
아력목강·애사%토이근·의포랍음%고이반·오포력%리철
文本分类%短语抽取%支持向量机%维吾尔语%互信息
文本分類%短語抽取%支持嚮量機%維吾爾語%互信息
문본분류%단어추취%지지향량궤%유오이어%호신식
文本特征表示是在文本自动分类中最重要的一个环节.在基于向量空间模型( VSM)的文本表示中特征单元粒度的选择直接影响到文本分类的效果.对于基于词袋模型(BOW)的维吾尔文文本分类效果不理想的问题,提出了一种基于统计方法的维吾尔语短语抽取算法并将抽取到的短语作为文本特征项,采用支持向量机( SVM)算法对维吾尔文文本进行了分类实验.实验结果表明,与以词为特征的文本分类相比,短语作为文本特征能够提高维吾尔文文本分类的准确率和召回率.
文本特徵錶示是在文本自動分類中最重要的一箇環節.在基于嚮量空間模型( VSM)的文本錶示中特徵單元粒度的選擇直接影響到文本分類的效果.對于基于詞袋模型(BOW)的維吾爾文文本分類效果不理想的問題,提齣瞭一種基于統計方法的維吾爾語短語抽取算法併將抽取到的短語作為文本特徵項,採用支持嚮量機( SVM)算法對維吾爾文文本進行瞭分類實驗.實驗結果錶明,與以詞為特徵的文本分類相比,短語作為文本特徵能夠提高維吾爾文文本分類的準確率和召迴率.
문본특정표시시재문본자동분류중최중요적일개배절.재기우향량공간모형( VSM)적문본표시중특정단원립도적선택직접영향도문본분류적효과.대우기우사대모형(BOW)적유오이문문본분류효과불이상적문제,제출료일충기우통계방법적유오이어단어추취산법병장추취도적단어작위문본특정항,채용지지향량궤( SVM)산법대유오이문문본진행료분류실험.실험결과표명,여이사위특정적문본분류상비,단어작위문본특정능구제고유오이문문본분류적준학솔화소회솔.