情报学报
情報學報
정보학보
2003年
3期
306-309
,共4页
施彤年%卢忠良%荣融%王家云
施彤年%盧忠良%榮融%王傢雲
시동년%로충량%영융%왕가운
多类多标签%分词%降维%弱假设%弱学习
多類多標籤%分詞%降維%弱假設%弱學習
다류다표첨%분사%강유%약가설%약학습
本文提出了一种高效的汉语文本分类方法,并在实验中收到了良好的效果.由于汉语文本的特殊性,在训练前对训练文本进行自动分词和降维预处理.许多文本往往可能归到多个类,分类算法采用改进的Boosting算法.实验表明,在多类多标签的汉语文本特征提取和文档分类中,该算法收敛快、准确性高、综合效果较好.
本文提齣瞭一種高效的漢語文本分類方法,併在實驗中收到瞭良好的效果.由于漢語文本的特殊性,在訓練前對訓練文本進行自動分詞和降維預處理.許多文本往往可能歸到多箇類,分類算法採用改進的Boosting算法.實驗錶明,在多類多標籤的漢語文本特徵提取和文檔分類中,該算法收斂快、準確性高、綜閤效果較好.
본문제출료일충고효적한어문본분류방법,병재실험중수도료량호적효과.유우한어문본적특수성,재훈련전대훈련문본진행자동분사화강유예처리.허다문본왕왕가능귀도다개류,분류산법채용개진적Boosting산법.실험표명,재다류다표첨적한어문본특정제취화문당분류중,해산법수렴쾌、준학성고、종합효과교호.