电子学报
電子學報
전자학보
Acta Electronica Sinica
2015年
7期
1356-1361
,共6页
孙雪%李昆仑%韩蕾%白晓亮
孫雪%李昆崙%韓蕾%白曉亮
손설%리곤륜%한뢰%백효량
概念漂移%LDA模型%特征项分布%信息熵
概唸漂移%LDA模型%特徵項分佈%信息熵
개념표이%LDA모형%특정항분포%신식적
concept drift%latent dirichlet allocation(LDA)%feature distribution%information entropy
现有的概念漂移算法大多建立在数据流的分类模型上,忽略了特征空间与样本空间的分布特点,以及特征选择和加权的重要性.针对此问题提出了一种基于特征项分布的信息熵及特征动态加权算法,从概念漂移的动态演化性出发,根据样本和特征空间的拟合程度,运用特征信息熵理论对数据流中的概念漂移现象进行捕捉,以实现新旧概念的过渡.利用改进的隐含Dirichlet模型特征动态加权算法,以解决当前特征与历史特征的权重确定和无效特征的裁剪问题.在公开的语料库CCERT和Trec06上的测试实验证明了所提出算法的有效性.
現有的概唸漂移算法大多建立在數據流的分類模型上,忽略瞭特徵空間與樣本空間的分佈特點,以及特徵選擇和加權的重要性.針對此問題提齣瞭一種基于特徵項分佈的信息熵及特徵動態加權算法,從概唸漂移的動態縯化性齣髮,根據樣本和特徵空間的擬閤程度,運用特徵信息熵理論對數據流中的概唸漂移現象進行捕捉,以實現新舊概唸的過渡.利用改進的隱含Dirichlet模型特徵動態加權算法,以解決噹前特徵與歷史特徵的權重確定和無效特徵的裁剪問題.在公開的語料庫CCERT和Trec06上的測試實驗證明瞭所提齣算法的有效性.
현유적개념표이산법대다건립재수거류적분류모형상,홀략료특정공간여양본공간적분포특점,이급특정선택화가권적중요성.침대차문제제출료일충기우특정항분포적신식적급특정동태가권산법,종개념표이적동태연화성출발,근거양본화특정공간적의합정도,운용특정신식적이론대수거류중적개념표이현상진행포착,이실현신구개념적과도.이용개진적은함Dirichlet모형특정동태가권산법,이해결당전특정여역사특정적권중학정화무효특정적재전문제.재공개적어료고CCERT화Trec06상적측시실험증명료소제출산법적유효성.