计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2010年
8期
98-100,103
,共4页
文本分类%数据挖掘%粗糙集%概念格%分类规则
文本分類%數據挖掘%粗糙集%概唸格%分類規則
문본분류%수거알굴%조조집%개념격%분류규칙
文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.概念格是规则提取和数据分析的有效工具,然而概念格的构造效率始终是概念格应用的一大难题.本文研究了基于扩展概念格模型的文本分类规则提取,利用粗糙集和扩展概念格模型来进行分类规则提取.该方法利用概念树,极大地除去了冗余的概念,只需要建造很少的概念就能够提取出全部的分类规则,不仅效率较高,而且同时提取的分类规则与概念格相同.本文算法在MATLAB7.0的环境中运行的实验表明,查全率比KNN算法和SVM算法稍低,但是查准率比它们都高,因此该分类规则用于文本分类时效果与KNN和SVM相当.
文本分類是信息檢索與數據挖掘領域的研究熱點與覈心技術,近年來得到瞭廣汎的關註和快速的髮展.概唸格是規則提取和數據分析的有效工具,然而概唸格的構造效率始終是概唸格應用的一大難題.本文研究瞭基于擴展概唸格模型的文本分類規則提取,利用粗糙集和擴展概唸格模型來進行分類規則提取.該方法利用概唸樹,極大地除去瞭冗餘的概唸,隻需要建造很少的概唸就能夠提取齣全部的分類規則,不僅效率較高,而且同時提取的分類規則與概唸格相同.本文算法在MATLAB7.0的環境中運行的實驗錶明,查全率比KNN算法和SVM算法稍低,但是查準率比它們都高,因此該分類規則用于文本分類時效果與KNN和SVM相噹.
문본분류시신식검색여수거알굴영역적연구열점여핵심기술,근년래득도료엄범적관주화쾌속적발전.개념격시규칙제취화수거분석적유효공구,연이개념격적구조효솔시종시개념격응용적일대난제.본문연구료기우확전개념격모형적문본분류규칙제취,이용조조집화확전개념격모형래진행분류규칙제취.해방법이용개념수,겁대지제거료용여적개념,지수요건조흔소적개념취능구제취출전부적분류규칙,불부효솔교고,이차동시제취적분류규칙여개념격상동.본문산법재MATLAB7.0적배경중운행적실험표명,사전솔비KNN산법화SVM산법초저,단시사준솔비타문도고,인차해분류규칙용우문본분류시효과여KNN화SVM상당.