计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2011年
11期
239-240,263
,共3页
文本分类%粗糙集%约简
文本分類%粗糙集%約簡
문본분류%조조집%약간
文本分类是中文信息处理的重要研究领域.给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率.粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过滤掉停用词之后把剩余的词语作为特征项,然后把文本用向量空间模型表示出来,将文本集转化成不带决策属性的信息系统,用粗糙集理论中核心内容属性约简实现对文本的分类.实验表明,该方法的查准率和查全率都有所提高.
文本分類是中文信息處理的重要研究領域.給文本分配一箇或多箇不同的類彆,可提高文本檢索和存儲的處理效率.粗糙集是一種不需要任何先驗信息的分類方法,通過對文本分詞、過濾掉停用詞之後把剩餘的詞語作為特徵項,然後把文本用嚮量空間模型錶示齣來,將文本集轉化成不帶決策屬性的信息繫統,用粗糙集理論中覈心內容屬性約簡實現對文本的分類.實驗錶明,該方法的查準率和查全率都有所提高.
문본분류시중문신식처리적중요연구영역.급문본분배일개혹다개불동적유별,가제고문본검색화존저적처리효솔.조조집시일충불수요임하선험신식적분류방법,통과대문본분사、과려도정용사지후파잉여적사어작위특정항,연후파문본용향량공간모형표시출래,장문본집전화성불대결책속성적신식계통,용조조집이론중핵심내용속성약간실현대문본적분류.실험표명,해방법적사준솔화사전솔도유소제고.