小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2013年
8期
1787-1792
,共6页
概念漂移%鞅%数据流%可交换性%相异度量
概唸漂移%鞅%數據流%可交換性%相異度量
개념표이%앙%수거류%가교환성%상이도량
concept drifting%martingale%data stream%exchangeability%strangeness measure
近年来,对数据流中概念漂移的检测成为了研究热点.本文依据统计学理论提出基于鞅的数据流概念漂移检测方法(CDDBM),首先综合考虑数据分布质心和半径改变引起概念的漂移,提出有效的相异度量方法,然后对数据流采用双向统计的方法更准确地标识数据分布并映射到均匀分布序列,最后计算双重随机幂鞅的均值,并利用停时定理来判断数据流中是否有概念漂移发生.另外,检测方法中,使用合理的阈值参数控制鞅变化的峰值,从而有效地降低了误报率和失报率,提出适当尺寸的窗口有效地应对数据流的无限性且更准确地推断漂移区间.在人工和真实数据流上的实验结果表明,该方法在数值型数据、分类型数据和混合型数据上都是有效的,并能够有效地控制错误率.
近年來,對數據流中概唸漂移的檢測成為瞭研究熱點.本文依據統計學理論提齣基于鞅的數據流概唸漂移檢測方法(CDDBM),首先綜閤攷慮數據分佈質心和半徑改變引起概唸的漂移,提齣有效的相異度量方法,然後對數據流採用雙嚮統計的方法更準確地標識數據分佈併映射到均勻分佈序列,最後計算雙重隨機冪鞅的均值,併利用停時定理來判斷數據流中是否有概唸漂移髮生.另外,檢測方法中,使用閤理的閾值參數控製鞅變化的峰值,從而有效地降低瞭誤報率和失報率,提齣適噹呎吋的窗口有效地應對數據流的無限性且更準確地推斷漂移區間.在人工和真實數據流上的實驗結果錶明,該方法在數值型數據、分類型數據和混閤型數據上都是有效的,併能夠有效地控製錯誤率.
근년래,대수거류중개념표이적검측성위료연구열점.본문의거통계학이론제출기우앙적수거류개념표이검측방법(CDDBM),수선종합고필수거분포질심화반경개변인기개념적표이,제출유효적상이도량방법,연후대수거류채용쌍향통계적방법경준학지표식수거분포병영사도균균분포서렬,최후계산쌍중수궤멱앙적균치,병이용정시정리래판단수거류중시부유개념표이발생.령외,검측방법중,사용합리적역치삼수공제앙변화적봉치,종이유효지강저료오보솔화실보솔,제출괄당척촌적창구유효지응대수거류적무한성차경준학지추단표이구간.재인공화진실수거류상적실험결과표명,해방법재수치형수거、분류형수거화혼합형수거상도시유효적,병능구유효지공제착오솔.