计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2010年
10期
165-168,180
,共5页
层次分类%支持向量机%中文信息分类标准%特征计算%错误控制
層次分類%支持嚮量機%中文信息分類標準%特徵計算%錯誤控製
층차분류%지지향량궤%중문신식분류표준%특정계산%착오공제
中文新闻信息分类标准中,类别数量大.在将其应用于新闻分类时,会出现训练模型大、训练时间长,尤其是当部分类别改变时需要全部重新训练等问题.由于分类标准中类别之间存在层次关系,因此层次分类方法可以作为解决方案.研究层次化的中文新闻分类方法,并从以下两方面改善层次化分类方法的效果:1)分层的新闻特征计算,解决了层次分类中新闻在分类类别下的特征向量的不同表示的问题;2)错误控制,解决了在上一层分类错误的情况下新闻不会分到正确的类别上的情况.实验结果表明,层次分类方法的效果比平面分类的准确度提高了约4%,进行多次特征权重计算的层次分类方法比普通的层次分类的准确度提高了约3%,同时进行错误控制的分类效果比普通层次的分类效果提高了大概3%.
中文新聞信息分類標準中,類彆數量大.在將其應用于新聞分類時,會齣現訓練模型大、訓練時間長,尤其是噹部分類彆改變時需要全部重新訓練等問題.由于分類標準中類彆之間存在層次關繫,因此層次分類方法可以作為解決方案.研究層次化的中文新聞分類方法,併從以下兩方麵改善層次化分類方法的效果:1)分層的新聞特徵計算,解決瞭層次分類中新聞在分類類彆下的特徵嚮量的不同錶示的問題;2)錯誤控製,解決瞭在上一層分類錯誤的情況下新聞不會分到正確的類彆上的情況.實驗結果錶明,層次分類方法的效果比平麵分類的準確度提高瞭約4%,進行多次特徵權重計算的層次分類方法比普通的層次分類的準確度提高瞭約3%,同時進行錯誤控製的分類效果比普通層次的分類效果提高瞭大概3%.
중문신문신식분류표준중,유별수량대.재장기응용우신문분류시,회출현훈련모형대、훈련시간장,우기시당부분유별개변시수요전부중신훈련등문제.유우분류표준중유별지간존재층차관계,인차층차분류방법가이작위해결방안.연구층차화적중문신문분류방법,병종이하량방면개선층차화분류방법적효과:1)분층적신문특정계산,해결료층차분류중신문재분류유별하적특정향량적불동표시적문제;2)착오공제,해결료재상일층분류착오적정황하신문불회분도정학적유별상적정황.실험결과표명,층차분류방법적효과비평면분류적준학도제고료약4%,진행다차특정권중계산적층차분류방법비보통적층차분류적준학도제고료약3%,동시진행착오공제적분류효과비보통층차적분류효과제고료대개3%.