计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2015年
1期
147-151
,共5页
张丹普%付忠良%王莉莉%李昕
張丹普%付忠良%王莉莉%李昕
장단보%부충량%왕리리%리흔
连续AdaBoost%浮动阈值%极大似然原理%多标签分类%集成学习%二分类方法
連續AdaBoost%浮動閾值%極大似然原理%多標籤分類%集成學習%二分類方法
련속AdaBoost%부동역치%겁대사연원리%다표첨분류%집성학습%이분류방법
real AdaBoost%floating threshold%maximum likelihood principle%multi-label classification%ensemble learning%Binary Relevance (BR) method
针对目标可以同时属于多个类别的多标签分类问题,提出了一种基于浮动阈值分类器组合的多标签分类算法.首先,分析探讨了基于浮动阈值分类器的AdaBoost算法(AdaBoost.FT)的原理及错误率估计,证明了该算法能克服固定分段阈值分类器对分类边界附近点分类不稳定的缺点从而提高分类准确率;然后,采用二分类(BR)方法将该单标签学习算法应用于多标签分类问题,得到基于浮动阈值分类器组合的多标签分类方法,即多标签AdaBoost.FT.实验结果表明,所提算法的平均分类精度在Emotions数据集上比AdaBoost.MH、ML-kNN、RankSVM这3种算法分别提高约4%、8%、11%;在Scene、Yeast数据集上仅比RankSVM低约3%、1%.由实验分析可知,在不同类别标记之间基本没有关联关系或标签数目较少的数据集上,该算法均能得到较好的分类效果.
針對目標可以同時屬于多箇類彆的多標籤分類問題,提齣瞭一種基于浮動閾值分類器組閤的多標籤分類算法.首先,分析探討瞭基于浮動閾值分類器的AdaBoost算法(AdaBoost.FT)的原理及錯誤率估計,證明瞭該算法能剋服固定分段閾值分類器對分類邊界附近點分類不穩定的缺點從而提高分類準確率;然後,採用二分類(BR)方法將該單標籤學習算法應用于多標籤分類問題,得到基于浮動閾值分類器組閤的多標籤分類方法,即多標籤AdaBoost.FT.實驗結果錶明,所提算法的平均分類精度在Emotions數據集上比AdaBoost.MH、ML-kNN、RankSVM這3種算法分彆提高約4%、8%、11%;在Scene、Yeast數據集上僅比RankSVM低約3%、1%.由實驗分析可知,在不同類彆標記之間基本沒有關聯關繫或標籤數目較少的數據集上,該算法均能得到較好的分類效果.
침대목표가이동시속우다개유별적다표첨분류문제,제출료일충기우부동역치분류기조합적다표첨분류산법.수선,분석탐토료기우부동역치분류기적AdaBoost산법(AdaBoost.FT)적원리급착오솔고계,증명료해산법능극복고정분단역치분류기대분류변계부근점분류불은정적결점종이제고분류준학솔;연후,채용이분류(BR)방법장해단표첨학습산법응용우다표첨분류문제,득도기우부동역치분류기조합적다표첨분류방법,즉다표첨AdaBoost.FT.실험결과표명,소제산법적평균분류정도재Emotions수거집상비AdaBoost.MH、ML-kNN、RankSVM저3충산법분별제고약4%、8%、11%;재Scene、Yeast수거집상부비RankSVM저약3%、1%.유실험분석가지,재불동유별표기지간기본몰유관련관계혹표첨수목교소적수거집상,해산법균능득도교호적분류효과.