中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2002年
3期
15-19
,共5页
文本分类%向量空间模型%Bayes后验概率%加权距离
文本分類%嚮量空間模型%Bayes後驗概率%加權距離
문본분류%향량공간모형%Bayes후험개솔%가권거리
本文提出了关于一个词的文本类间频率的概念,给出一个词在文本分类中的区分度的定义,讨论了区分度的性质,提出了选择特词新的方法,定义了特征词的权重,建立了向量空间模型的一套加权距离分类规则.实验结果表明,本文的方法是有效和有用的.
本文提齣瞭關于一箇詞的文本類間頻率的概唸,給齣一箇詞在文本分類中的區分度的定義,討論瞭區分度的性質,提齣瞭選擇特詞新的方法,定義瞭特徵詞的權重,建立瞭嚮量空間模型的一套加權距離分類規則.實驗結果錶明,本文的方法是有效和有用的.
본문제출료관우일개사적문본류간빈솔적개념,급출일개사재문본분류중적구분도적정의,토론료구분도적성질,제출료선택특사신적방법,정의료특정사적권중,건립료향량공간모형적일투가권거리분류규칙.실험결과표명,본문적방법시유효화유용적.