软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2011年
4期
709-721
,共13页
集成学习%选择性集成%频繁模式树%Bagging%误差反向传播神经网络
集成學習%選擇性集成%頻繁模式樹%Bagging%誤差反嚮傳播神經網絡
집성학습%선택성집성%빈번모식수%Bagging%오차반향전파신경망락
选择性集成通过选择部分基分类器参与集成,从而提高集成分类器的泛化能力,降低预测开销.但已有的选择性集成算法普遍耗时较长,将数据挖掘的技术应用于选择性集成,提出一种基于FP-Tree(frequent pattern tree)的快速选择性集成算法:CPM-EP(coverage based pattern mining for ensemble pruning).该算法将基分类器对校验样本集的分类结果组织成一个事务数据库,从而使选择性集成问题可转化为对事务数据集的处理问题.针对所有可能的集成分类器大小,CPM-EP算法首先得到一个精简的事务数据库,并创建一棵FP-Tree树保存其内容;然后,基于该FP-Tree获得相应大小的集成分类器.在获得的所有集成分类器中,对校验样本集预测精度最高的集成分类器即为算法的输出.实验结果表明,CPM-EP算法以很低的计算开销获得优越的泛化能力,其分类器选择时间约为GASEN的1/19以及Forward-Selection的1/8,其泛化能力显著优于参与比较的其他方法,而且产生的集成分类器具有较少的基分类器.
選擇性集成通過選擇部分基分類器參與集成,從而提高集成分類器的汎化能力,降低預測開銷.但已有的選擇性集成算法普遍耗時較長,將數據挖掘的技術應用于選擇性集成,提齣一種基于FP-Tree(frequent pattern tree)的快速選擇性集成算法:CPM-EP(coverage based pattern mining for ensemble pruning).該算法將基分類器對校驗樣本集的分類結果組織成一箇事務數據庫,從而使選擇性集成問題可轉化為對事務數據集的處理問題.針對所有可能的集成分類器大小,CPM-EP算法首先得到一箇精簡的事務數據庫,併創建一棵FP-Tree樹保存其內容;然後,基于該FP-Tree穫得相應大小的集成分類器.在穫得的所有集成分類器中,對校驗樣本集預測精度最高的集成分類器即為算法的輸齣.實驗結果錶明,CPM-EP算法以很低的計算開銷穫得優越的汎化能力,其分類器選擇時間約為GASEN的1/19以及Forward-Selection的1/8,其汎化能力顯著優于參與比較的其他方法,而且產生的集成分類器具有較少的基分類器.
선택성집성통과선택부분기분류기삼여집성,종이제고집성분류기적범화능력,강저예측개소.단이유적선택성집성산법보편모시교장,장수거알굴적기술응용우선택성집성,제출일충기우FP-Tree(frequent pattern tree)적쾌속선택성집성산법:CPM-EP(coverage based pattern mining for ensemble pruning).해산법장기분류기대교험양본집적분류결과조직성일개사무수거고,종이사선택성집성문제가전화위대사무수거집적처리문제.침대소유가능적집성분류기대소,CPM-EP산법수선득도일개정간적사무수거고,병창건일과FP-Tree수보존기내용;연후,기우해FP-Tree획득상응대소적집성분류기.재획득적소유집성분류기중,대교험양본집예측정도최고적집성분류기즉위산법적수출.실험결과표명,CPM-EP산법이흔저적계산개소획득우월적범화능력,기분류기선택시간약위GASEN적1/19이급Forward-Selection적1/8,기범화능력현저우우삼여비교적기타방법,이차산생적집성분류기구유교소적기분류기.