计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2008年
2期
147-149
,共3页
中文信息处理%粗糙集%文本分类%向量空间模型
中文信息處理%粗糙集%文本分類%嚮量空間模型
중문신식처리%조조집%문본분류%향량공간모형
中文文本分类是中文信息检索和Web挖掘等领域的研究热点.现有的一些分类方法在特征选择阶段存在不足,忽略了隐含的子类信息.本文提出了一种提升隐含子类的关键词权值的方法,从而可以发现有价值的子类信息,进而使用粗糙集构建分类器.实验结果表明这种方法在不增加待约简词汇数量的情况下有效地提高了文本分类的查全率.
中文文本分類是中文信息檢索和Web挖掘等領域的研究熱點.現有的一些分類方法在特徵選擇階段存在不足,忽略瞭隱含的子類信息.本文提齣瞭一種提升隱含子類的關鍵詞權值的方法,從而可以髮現有價值的子類信息,進而使用粗糙集構建分類器.實驗結果錶明這種方法在不增加待約簡詞彙數量的情況下有效地提高瞭文本分類的查全率.
중문문본분류시중문신식검색화Web알굴등영역적연구열점.현유적일사분류방법재특정선택계단존재불족,홀략료은함적자류신식.본문제출료일충제승은함자류적관건사권치적방법,종이가이발현유개치적자류신식,진이사용조조집구건분류기.실험결과표명저충방법재불증가대약간사회수량적정황하유효지제고료문본분류적사전솔.