科技通报
科技通報
과기통보
BULLETIN OF SCIENCE AND TECHNOLOGY
2014年
9期
167-172
,共6页
邢丽莉%张兵%鹿玉红%李忠%周海全
邢麗莉%張兵%鹿玉紅%李忠%週海全
형려리%장병%록옥홍%리충%주해전
支持向量机%粗糙集%约简%加权
支持嚮量機%粗糙集%約簡%加權
지지향량궤%조조집%약간%가권
SVM%rough set%reduction%weighting
针对Web中文文本分类中现有权重计算方法的不足和支持向量机算法对大数据量模式分类的低效性,提出了基于粗糙集约简并且加权的支持向量机分类方法;粗糙集作为支持向量机分类的前期预处理器,应用粗糙集的约简理论和基于Web中文文本的可变精度粗糙集加权方法对分类前的数据分别进行简化并计算权重,从而提高支持向量机后期分类的效率和精度;实验结果表明,支持向量机对约简并加权后的数据进行分类,分类性能得到了进一步保证。
針對Web中文文本分類中現有權重計算方法的不足和支持嚮量機算法對大數據量模式分類的低效性,提齣瞭基于粗糙集約簡併且加權的支持嚮量機分類方法;粗糙集作為支持嚮量機分類的前期預處理器,應用粗糙集的約簡理論和基于Web中文文本的可變精度粗糙集加權方法對分類前的數據分彆進行簡化併計算權重,從而提高支持嚮量機後期分類的效率和精度;實驗結果錶明,支持嚮量機對約簡併加權後的數據進行分類,分類性能得到瞭進一步保證。
침대Web중문문본분류중현유권중계산방법적불족화지지향량궤산법대대수거량모식분류적저효성,제출료기우조조집약간병차가권적지지향량궤분류방법;조조집작위지지향량궤분류적전기예처리기,응용조조집적약간이론화기우Web중문문본적가변정도조조집가권방법대분류전적수거분별진행간화병계산권중,종이제고지지향량궤후기분류적효솔화정도;실험결과표명,지지향량궤대약간병가권후적수거진행분류,분류성능득도료진일보보증。
The existing weight computation methods and support vector machine (SVM) algorithm are low-efficiency in large amount of data pattern classification of Chinese web text, so that a classification algorithm of SVM based on rough set reduction and weighting is proposed in the paper. In the algorithm, rough set is used as preprocessor of SVM classification, and then the data is simplified with weight calculated using rough set reduction theory and variable precision rough set weighting method, in order to enhance the efficiency and precision of classification. The experimental data shows that the classification performance is further improved.