厦门大学学报(自然科学版)
廈門大學學報(自然科學版)
하문대학학보(자연과학판)
JOURNAL OF XIAMEN UNIVERSITY (NATURAL SCIENCE)
2005年
z1期
239-242
,共4页
文本分类%特征选择%文档频数%互信息量
文本分類%特徵選擇%文檔頻數%互信息量
문본분류%특정선택%문당빈수%호신식량
在介绍文本分类的背景及传统基于向量空间模型特征选择不足之处的同时,提出了不同特征选择方法相结合的文本分类模型.该模型首先对文本进行分析,把文本表示成向量空间的形式.文本在经过预处理后,按一定规则提取关键词的提取中增加了对名词短语的识别.特征选择的方法上,结合了文档频数和互信息量,并对他们进行了改进.实验结果表明,使用新方法进行分类所得到的分类精度得到了一定的提高.关键词,
在介紹文本分類的揹景及傳統基于嚮量空間模型特徵選擇不足之處的同時,提齣瞭不同特徵選擇方法相結閤的文本分類模型.該模型首先對文本進行分析,把文本錶示成嚮量空間的形式.文本在經過預處理後,按一定規則提取關鍵詞的提取中增加瞭對名詞短語的識彆.特徵選擇的方法上,結閤瞭文檔頻數和互信息量,併對他們進行瞭改進.實驗結果錶明,使用新方法進行分類所得到的分類精度得到瞭一定的提高.關鍵詞,
재개소문본분류적배경급전통기우향량공간모형특정선택불족지처적동시,제출료불동특정선택방법상결합적문본분류모형.해모형수선대문본진행분석,파문본표시성향량공간적형식.문본재경과예처리후,안일정규칙제취관건사적제취중증가료대명사단어적식별.특정선택적방법상,결합료문당빈수화호신식량,병대타문진행료개진.실험결과표명,사용신방법진행분류소득도적분류정도득도료일정적제고.관건사,