广西师范大学学报(自然科学版)
廣西師範大學學報(自然科學版)
엄서사범대학학보(자연과학판)
JOURNAL OF GUANGXI NORMAL UNIVERSITY(NATURAL SCIENCE EDITION)
2011年
1期
129-132
,共4页
袁鼎荣%谢扬才%陆广泉%刘星
袁鼎榮%謝颺纔%陸廣泉%劉星
원정영%사양재%륙엄천%류성
文本分类%特征选择%Chi2假设检验%独立度%模糊软集合
文本分類%特徵選擇%Chi2假設檢驗%獨立度%模糊軟集閤
문본분류%특정선택%Chi2가설검험%독립도%모호연집합
文本分类技术是文本信息处理的核心技术之一,主要包括文本的向量模型表示、文本特征选择和分类器训练三大过程.本文提出了一种混合(EIBA+DHChi2)特征选择算法,并将所获取的特征作为软集合理论中的参数集进行文本分类,从而建立了一种新的基于软集合理论的文本分类技术.实验表明查准率与查全率比原有算法都有所提高,说明新的基于软集合理论的文本分类算法是有效的.
文本分類技術是文本信息處理的覈心技術之一,主要包括文本的嚮量模型錶示、文本特徵選擇和分類器訓練三大過程.本文提齣瞭一種混閤(EIBA+DHChi2)特徵選擇算法,併將所穫取的特徵作為軟集閤理論中的參數集進行文本分類,從而建立瞭一種新的基于軟集閤理論的文本分類技術.實驗錶明查準率與查全率比原有算法都有所提高,說明新的基于軟集閤理論的文本分類算法是有效的.
문본분류기술시문본신식처리적핵심기술지일,주요포괄문본적향량모형표시、문본특정선택화분류기훈련삼대과정.본문제출료일충혼합(EIBA+DHChi2)특정선택산법,병장소획취적특정작위연집합이론중적삼수집진행문본분류,종이건립료일충신적기우연집합이론적문본분류기술.실험표명사준솔여사전솔비원유산법도유소제고,설명신적기우연집합이론적문본분류산법시유효적.