中文信息学报
中文信息學報
중문신식학보
JOURNAL OF CHINESE INFORMAITON PROCESSING
2005年
5期
11-15,23
,共6页
计算机应用%中文信息处理%文本分类%在线学习%增量学习%支持向量机%SMO
計算機應用%中文信息處理%文本分類%在線學習%增量學習%支持嚮量機%SMO
계산궤응용%중문신식처리%문본분류%재선학습%증량학습%지지향량궤%SMO
本文提出了一种用于文本分类的RBF支持向量机在线学习算法.利用RBF核函数的局部性,该算法仅对新训练样本的某一大小邻域内且位于"可能带"中的训练样本集进行重新训练,以实现对现有SVM的更新.为高效的实现该邻域大小的自适应确定,使用ξα泛化错误估计在所有现有训练样本集上对当前SVM的泛化错误进行定性估计.同时引入泛化能力进化因子,使得结果SVM在分类效果上具有自动调整能力,并防止分类能力的退化.在TREC-5真实语料上的对比测试结果表明,该算法显著地加速了增量学习的过程而同时保证结果SVM的分类效果.
本文提齣瞭一種用于文本分類的RBF支持嚮量機在線學習算法.利用RBF覈函數的跼部性,該算法僅對新訓練樣本的某一大小鄰域內且位于"可能帶"中的訓練樣本集進行重新訓練,以實現對現有SVM的更新.為高效的實現該鄰域大小的自適應確定,使用ξα汎化錯誤估計在所有現有訓練樣本集上對噹前SVM的汎化錯誤進行定性估計.同時引入汎化能力進化因子,使得結果SVM在分類效果上具有自動調整能力,併防止分類能力的退化.在TREC-5真實語料上的對比測試結果錶明,該算法顯著地加速瞭增量學習的過程而同時保證結果SVM的分類效果.
본문제출료일충용우문본분류적RBF지지향량궤재선학습산법.이용RBF핵함수적국부성,해산법부대신훈련양본적모일대소린역내차위우"가능대"중적훈련양본집진행중신훈련,이실현대현유SVM적경신.위고효적실현해린역대소적자괄응학정,사용ξα범화착오고계재소유현유훈련양본집상대당전SVM적범화착오진행정성고계.동시인입범화능력진화인자,사득결과SVM재분류효과상구유자동조정능력,병방지분류능력적퇴화.재TREC-5진실어료상적대비측시결과표명,해산법현저지가속료증량학습적과정이동시보증결과SVM적분류효과.