计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2014年
10期
136-140,265
,共6页
李玉鑑%李玉雄%冷强奎
李玉鑑%李玉雄%冷彊奎
리옥감%리옥웅%랭강규
非凸在线支持向量机%支持向量机%特征项%词频%相关频率%文本分类
非凸在線支持嚮量機%支持嚮量機%特徵項%詞頻%相關頻率%文本分類
비철재선지지향량궤%지지향량궤%특정항%사빈%상관빈솔%문본분류
non-convex online support vector machine%support vector machines%term weighting%term frequency%relevance frequency%text classification
非凸在线支持向量机(LASVM-NC)具有抗噪能力强和训练速度快的优点,而词频相关频率积(tf.rf)则是一种自适应能力很强、分类性能非常好的文本特征。通过把非凸在线支持向量机和词频相关频率积相结合,提出了一种新的文本分类方法,即LASVM-NC+tf.rf。实验结果表明,这种方法在LASVM-NC与多种其他特征的结合中性能是最好的,且与SVM+tf.rf相比,不仅所产生的分类器具有泛化能力更强、模型表达更稀疏的优点,而且在处理含噪声的数据时具有更好的鲁棒性,在处理大规模数据时具有快得多的训练速度。
非凸在線支持嚮量機(LASVM-NC)具有抗譟能力彊和訓練速度快的優點,而詞頻相關頻率積(tf.rf)則是一種自適應能力很彊、分類性能非常好的文本特徵。通過把非凸在線支持嚮量機和詞頻相關頻率積相結閤,提齣瞭一種新的文本分類方法,即LASVM-NC+tf.rf。實驗結果錶明,這種方法在LASVM-NC與多種其他特徵的結閤中性能是最好的,且與SVM+tf.rf相比,不僅所產生的分類器具有汎化能力更彊、模型錶達更稀疏的優點,而且在處理含譟聲的數據時具有更好的魯棒性,在處理大規模數據時具有快得多的訓練速度。
비철재선지지향량궤(LASVM-NC)구유항조능력강화훈련속도쾌적우점,이사빈상관빈솔적(tf.rf)칙시일충자괄응능력흔강、분류성능비상호적문본특정。통과파비철재선지지향량궤화사빈상관빈솔적상결합,제출료일충신적문본분류방법,즉LASVM-NC+tf.rf。실험결과표명,저충방법재LASVM-NC여다충기타특정적결합중성능시최호적,차여SVM+tf.rf상비,불부소산생적분류기구유범화능력경강、모형표체경희소적우점,이차재처리함조성적수거시구유경호적로봉성,재처리대규모수거시구유쾌득다적훈련속도。
Non-convex online support vector machine(LASVM-NC)has the advantages of strong anti-noise ability and fast training speed, while term frequency relevance frequency product(tf.rf)is a very good text feature for adaptive classi-fication performance. LASVM-NC+tf.rf is proposed as a new text classification method by combining non-convex support vector machines with term frequency relevance frequency product. It has been shown that the method can perform better than LASVM-NC plus many other features. Moreover, the method can produce faster trained and more robust classifiers with greater generalization and sparser expression than SVM+tf.rf in processing noisy and large-scale datasets.