计算机工程与科学
計算機工程與科學
계산궤공정여과학
COMPUTER ENGINEERING & SCIENCE
2014年
5期
977-985
,共9页
特征选择%特征漂移%概念漂移%数据流%互信息%集成分类器
特徵選擇%特徵漂移%概唸漂移%數據流%互信息%集成分類器
특정선택%특정표이%개념표이%수거류%호신식%집성분류기
Key words : feature selection%feature drifting%concept drifting%data stream%mutual information%ensemble classifier
为构建更加有效的隐含概念漂移数据流分类器,依据不同数据特征对分类关键程度不同的理论,提出基于特征漂移的数据流集成分类方法(ECFD).首先,给出了特征漂移的概念及其与概念漂移的关系;然后,利用互信息理论提出一种适合数据流的无监督特征选择技术(UFF),从而析取关键特征子集以检测特征漂移;最后,选用具有概念漂移处理能力的基础分类算法,在关键特征子集上建立异构集成分类器,该方法展示了一种隐含概念漂移高维数据流分类的新思路.大量实验结果显示,尤其在高维数据流中,该方法在精度、运行速度及可扩展性方面都有较好的表现.
為構建更加有效的隱含概唸漂移數據流分類器,依據不同數據特徵對分類關鍵程度不同的理論,提齣基于特徵漂移的數據流集成分類方法(ECFD).首先,給齣瞭特徵漂移的概唸及其與概唸漂移的關繫;然後,利用互信息理論提齣一種適閤數據流的無鑑督特徵選擇技術(UFF),從而析取關鍵特徵子集以檢測特徵漂移;最後,選用具有概唸漂移處理能力的基礎分類算法,在關鍵特徵子集上建立異構集成分類器,該方法展示瞭一種隱含概唸漂移高維數據流分類的新思路.大量實驗結果顯示,尤其在高維數據流中,該方法在精度、運行速度及可擴展性方麵都有較好的錶現.
위구건경가유효적은함개념표이수거류분류기,의거불동수거특정대분류관건정도불동적이론,제출기우특정표이적수거류집성분류방법(ECFD).수선,급출료특정표이적개념급기여개념표이적관계;연후,이용호신식이론제출일충괄합수거류적무감독특정선택기술(UFF),종이석취관건특정자집이검측특정표이;최후,선용구유개념표이처리능력적기출분류산법,재관건특정자집상건립이구집성분류기,해방법전시료일충은함개념표이고유수거류분류적신사로.대량실험결과현시,우기재고유수거류중,해방법재정도、운행속도급가확전성방면도유교호적표현.