华中科技大学学报(自然科学版)
華中科技大學學報(自然科學版)
화중과기대학학보(자연과학판)
JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY(NATURE SCIENCE)
2005年
3期
53-55
,共3页
文本分类%向量空间模型%特征提取%结构层次权重系数%训练算法%分类算法
文本分類%嚮量空間模型%特徵提取%結構層次權重繫數%訓練算法%分類算法
문본분류%향량공간모형%특정제취%결구층차권중계수%훈련산법%분류산법
阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现,包括对该系统的结构、预处理、特征提取、训练算法,分类算法等关键技术的介绍.通过引入结构层次权重系数来改进文本特征项权重,同时提出一种新的训练算法和文本相似度域值计算方法.实验结果证明:该分类系统能有效地提高文本分类效果,开放性测试的平均准确率在80 %以上,且平均查全率达到了86%.
闡述瞭一箇基于改進嚮量空間模型的中文文本分類繫統的設計與實現,包括對該繫統的結構、預處理、特徵提取、訓練算法,分類算法等關鍵技術的介紹.通過引入結構層次權重繫數來改進文本特徵項權重,同時提齣一種新的訓練算法和文本相似度域值計算方法.實驗結果證明:該分類繫統能有效地提高文本分類效果,開放性測試的平均準確率在80 %以上,且平均查全率達到瞭86%.
천술료일개기우개진향량공간모형적중문문본분류계통적설계여실현,포괄대해계통적결구、예처리、특정제취、훈련산법,분류산법등관건기술적개소.통과인입결구층차권중계수래개진문본특정항권중,동시제출일충신적훈련산법화문본상사도역치계산방법.실험결과증명:해분류계통능유효지제고문본분류효과,개방성측시적평균준학솔재80 %이상,차평균사전솔체도료86%.