计算机工程与设计
計算機工程與設計
계산궤공정여설계
COMPUTER ENGINEERING AND DESIGN
2009年
1期
122-124,131
,共4页
集成学习%文本分类%中心法%分类器偏差%权重分布
集成學習%文本分類%中心法%分類器偏差%權重分佈
집성학습%문본분류%중심법%분류기편차%권중분포
文本信息的爆炸式增长提出了对适宜实时应用的简单快速文本分类的需求,中心分类法虽然快速,但它所基于的假设常常与事实相违,导致分类模型偏差.基于集成学习中的AdaBoost.MR算法,通过利用其自适应维护权重分布的特点,用每轮的权重分布,修正传统中心法分类器偏差,突出被误分类的文档的影响,降低其误分类概率.在YQ-WEBBENCH-V1.1上的实验表明效果良好.
文本信息的爆炸式增長提齣瞭對適宜實時應用的簡單快速文本分類的需求,中心分類法雖然快速,但它所基于的假設常常與事實相違,導緻分類模型偏差.基于集成學習中的AdaBoost.MR算法,通過利用其自適應維護權重分佈的特點,用每輪的權重分佈,脩正傳統中心法分類器偏差,突齣被誤分類的文檔的影響,降低其誤分類概率.在YQ-WEBBENCH-V1.1上的實驗錶明效果良好.
문본신식적폭작식증장제출료대괄의실시응용적간단쾌속문본분류적수구,중심분류법수연쾌속,단타소기우적가설상상여사실상위,도치분류모형편차.기우집성학습중적AdaBoost.MR산법,통과이용기자괄응유호권중분포적특점,용매륜적권중분포,수정전통중심법분류기편차,돌출피오분류적문당적영향,강저기오분류개솔.재YQ-WEBBENCH-V1.1상적실험표명효과량호.