计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2006年
24期
160-163
,共4页
文本分类%支持向量机%SMO算法%噪声样本
文本分類%支持嚮量機%SMO算法%譟聲樣本
문본분류%지지향량궤%SMO산법%조성양본
近年来,随着序列最小优化分类算法SMO等一系列快速算法的推出,支持向量机在自动文本分类研究领域取得了很大的成功.大多数文本分类问题是线性可分的,使用线性核函数的SMO算法能够取得非常好的分类效果.但是文本向量是一种非常稀疏的向量,采用线性核函数的SMO算法对噪声样本非常敏感,容易产生发散的问题.文章分析证明了噪声如何影响SMO算法收敛性.为了解决训练样本中噪声样本影响SMO算法收敛的问题,设计了一个消除噪声样本的算法,取得了非常好的效果.
近年來,隨著序列最小優化分類算法SMO等一繫列快速算法的推齣,支持嚮量機在自動文本分類研究領域取得瞭很大的成功.大多數文本分類問題是線性可分的,使用線性覈函數的SMO算法能夠取得非常好的分類效果.但是文本嚮量是一種非常稀疏的嚮量,採用線性覈函數的SMO算法對譟聲樣本非常敏感,容易產生髮散的問題.文章分析證明瞭譟聲如何影響SMO算法收斂性.為瞭解決訓練樣本中譟聲樣本影響SMO算法收斂的問題,設計瞭一箇消除譟聲樣本的算法,取得瞭非常好的效果.
근년래,수착서렬최소우화분류산법SMO등일계렬쾌속산법적추출,지지향량궤재자동문본분류연구영역취득료흔대적성공.대다수문본분류문제시선성가분적,사용선성핵함수적SMO산법능구취득비상호적분류효과.단시문본향량시일충비상희소적향량,채용선성핵함수적SMO산법대조성양본비상민감,용역산생발산적문제.문장분석증명료조성여하영향SMO산법수렴성.위료해결훈련양본중조성양본영향SMO산법수렴적문제,설계료일개소제조성양본적산법,취득료비상호적효과.