现代计算机(普及版)
現代計算機(普及版)
현대계산궤(보급판)
MODERN COMPUTER
2014年
9期
16-20
,共5页
王义忠%刘循%吴迪
王義忠%劉循%吳迪
왕의충%류순%오적
支持向量机%文本分类%核函数%欧氏距离
支持嚮量機%文本分類%覈函數%歐氏距離
지지향량궤%문본분류%핵함수%구씨거리
Support Vector Machine%Text Categorization%Kernel Function%Euclidean Distance
在研究基于支持向量机进行文本分类一般步骤的基础上,针对Key-Substring-Group文本分类算法存在非线性支持向量机对核函数和参数C的强依赖的问题,用欧氏距离代替支持向量机训练得到的分类决策面进行分类决策,对文本分类算法进行改进。通过对比试验,发现分类效果不会随着核函数及参数C的变化而有明显的波动。
在研究基于支持嚮量機進行文本分類一般步驟的基礎上,針對Key-Substring-Group文本分類算法存在非線性支持嚮量機對覈函數和參數C的彊依賴的問題,用歐氏距離代替支持嚮量機訓練得到的分類決策麵進行分類決策,對文本分類算法進行改進。通過對比試驗,髮現分類效果不會隨著覈函數及參數C的變化而有明顯的波動。
재연구기우지지향량궤진행문본분류일반보취적기출상,침대Key-Substring-Group문본분류산법존재비선성지지향량궤대핵함수화삼수C적강의뢰적문제,용구씨거리대체지지향량궤훈련득도적분류결책면진행분류결책,대문본분류산법진행개진。통과대비시험,발현분류효과불회수착핵함수급삼수C적변화이유명현적파동。
Studyies general steps for text categorization algorithm based on support vector machine theory, in order to solve the problem that non-linear SVM has a strong correlation with kernel functions and parameter C for algorithm in document. Replaces the hyper-plane got by SVM learning with Euclidean Distance to make categorization decision. Through contrast experiment shows the categorization accuracy has no large fluctuation with different kernel functions and parameter C.