软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2007年
4期
905-918
,共14页
进化数据流%聚类%滑动窗口
進化數據流%聚類%滑動窗口
진화수거류%취류%활동창구
提出了纳伪(false positive)和拒真(false negative)两种聚类特征指数直方图分别来支持纳伪误差和拒真误差窗口的聚类分析;然后,提出一种基于滑动窗口的数据流聚类方法.该方法在占用窗口大小的次线性内存空间前提下,及时保存最近数据记录的分布状况,从而实现对滑动窗口内的数据进行聚类.此外,它还可被扩展用于N-n窗口(滑动窗口的扩展模型)的数据聚类.实验采用KDD-CUP'99和KDD-CUP'98真实数据集以及变换高斯分布的人工数据集构造进化数据流.理论分析和实验结果表明,该方法具有良好的聚类质量、较小的内存开销和快速的数据处理能力.
提齣瞭納偽(false positive)和拒真(false negative)兩種聚類特徵指數直方圖分彆來支持納偽誤差和拒真誤差窗口的聚類分析;然後,提齣一種基于滑動窗口的數據流聚類方法.該方法在佔用窗口大小的次線性內存空間前提下,及時保存最近數據記錄的分佈狀況,從而實現對滑動窗口內的數據進行聚類.此外,它還可被擴展用于N-n窗口(滑動窗口的擴展模型)的數據聚類.實驗採用KDD-CUP'99和KDD-CUP'98真實數據集以及變換高斯分佈的人工數據集構造進化數據流.理論分析和實驗結果錶明,該方法具有良好的聚類質量、較小的內存開銷和快速的數據處理能力.
제출료납위(false positive)화거진(false negative)량충취류특정지수직방도분별래지지납위오차화거진오차창구적취류분석;연후,제출일충기우활동창구적수거류취류방법.해방법재점용창구대소적차선성내존공간전제하,급시보존최근수거기록적분포상황,종이실현대활동창구내적수거진행취류.차외,타환가피확전용우N-n창구(활동창구적확전모형)적수거취류.실험채용KDD-CUP'99화KDD-CUP'98진실수거집이급변환고사분포적인공수거집구조진화수거류.이론분석화실험결과표명,해방법구유량호적취류질량、교소적내존개소화쾌속적수거처리능력.