微计算机信息
微計算機信息
미계산궤신식
CONTROL & AUTOMATION
2008年
6期
197-199
,共3页
张冬慧%孙波%徐照财%程显毅
張鼕慧%孫波%徐照財%程顯毅
장동혜%손파%서조재%정현의
中文分词%向量空间模型%文本分类%支持向量机
中文分詞%嚮量空間模型%文本分類%支持嚮量機
중문분사%향량공간모형%문본분류%지지향량궤
为了提高文本自动分类的准确率,本文在分析文本分类预处理阶段的中文分词、特征提取、向量空间模型、web结构挖掘技术等基础上,对相关技术进行了的改进,并设计基于支持向量机文本分类器(UJS-Classifier)实现了最终的文本分类.根据测试语料分别对中文分词模块和网页文本分类模块性能进行测试,实验结果表明UJS-Classifier在分词的歧义切分、网页分类的性能及准确率都有一定的提高.
為瞭提高文本自動分類的準確率,本文在分析文本分類預處理階段的中文分詞、特徵提取、嚮量空間模型、web結構挖掘技術等基礎上,對相關技術進行瞭的改進,併設計基于支持嚮量機文本分類器(UJS-Classifier)實現瞭最終的文本分類.根據測試語料分彆對中文分詞模塊和網頁文本分類模塊性能進行測試,實驗結果錶明UJS-Classifier在分詞的歧義切分、網頁分類的性能及準確率都有一定的提高.
위료제고문본자동분류적준학솔,본문재분석문본분류예처리계단적중문분사、특정제취、향량공간모형、web결구알굴기술등기출상,대상관기술진행료적개진,병설계기우지지향량궤문본분류기(UJS-Classifier)실현료최종적문본분류.근거측시어료분별대중문분사모괴화망혈문본분류모괴성능진행측시,실험결과표명UJS-Classifier재분사적기의절분、망혈분류적성능급준학솔도유일정적제고.