中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2002年
3期
8-14,26
,共8页
刘少辉%董明楷%张海俊%李蓉%史忠植
劉少輝%董明楷%張海俊%李蓉%史忠植
류소휘%동명해%장해준%리용%사충식
文本分类%向量空间模型%信息增益%特征提取
文本分類%嚮量空間模型%信息增益%特徵提取
문본분류%향량공간모형%신식증익%특정제취
本文研究和改进了经典的向量空间模型(VSM)的词语权重计算方法,并在此基础上提出了一种基于向量空间模型的多层次文本分类方法.也就是把各类按照一定的层次关系组织成树状结构,并将一个类中的所有训练文档合并为一个类文档,在提取各类模型时只在同层同一结点下的类文档之间进行比较;而对文档进行自动分类时,首先从根结点开始找到对应的大类,然后递归往下直到找到对应的叶子子类.实验和实际系统表明,该方法具有较高的正确率和召回率.
本文研究和改進瞭經典的嚮量空間模型(VSM)的詞語權重計算方法,併在此基礎上提齣瞭一種基于嚮量空間模型的多層次文本分類方法.也就是把各類按照一定的層次關繫組織成樹狀結構,併將一箇類中的所有訓練文檔閤併為一箇類文檔,在提取各類模型時隻在同層同一結點下的類文檔之間進行比較;而對文檔進行自動分類時,首先從根結點開始找到對應的大類,然後遞歸往下直到找到對應的葉子子類.實驗和實際繫統錶明,該方法具有較高的正確率和召迴率.
본문연구화개진료경전적향량공간모형(VSM)적사어권중계산방법,병재차기출상제출료일충기우향량공간모형적다층차문본분류방법.야취시파각류안조일정적층차관계조직성수상결구,병장일개류중적소유훈련문당합병위일개류문당,재제취각류모형시지재동층동일결점하적류문당지간진행비교;이대문당진행자동분류시,수선종근결점개시조도대응적대류,연후체귀왕하직도조도대응적협자자류.실험화실제계통표명,해방법구유교고적정학솔화소회솔.