软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2009年
5期
1313-1328
,共16页
概率数据流%聚类%演化分析
概率數據流%聚類%縯化分析
개솔수거류%취류%연화분석
提出-种在概率数据流上进行聚类的有效方法P-Stream.P-Stream针对数据流上的概率元组提出强簇、过渡簇和弱簇的概念,设计-种有效的在线候选簇选择策略,为每个不断到达的数据元组合理地找到可能归属的簇,并在每个检查点存储微簇快照,以便离线进-步高层聚类和演化分析.最后设计-个"积极"的二层聚类模型来判断现有的第1层聚类模型是否还适应数据流中最近到达的概率元组.实验采用KDD-CUP'98和KDD-CUP'99真实数据集以及变换高斯分布的人工数据集构造概率数据流.实验结果表明,P-Stream具有良好的聚类质量、较快的处理速度,能够有效地适应数据演化情况.
提齣-種在概率數據流上進行聚類的有效方法P-Stream.P-Stream針對數據流上的概率元組提齣彊簇、過渡簇和弱簇的概唸,設計-種有效的在線候選簇選擇策略,為每箇不斷到達的數據元組閤理地找到可能歸屬的簇,併在每箇檢查點存儲微簇快照,以便離線進-步高層聚類和縯化分析.最後設計-箇"積極"的二層聚類模型來判斷現有的第1層聚類模型是否還適應數據流中最近到達的概率元組.實驗採用KDD-CUP'98和KDD-CUP'99真實數據集以及變換高斯分佈的人工數據集構造概率數據流.實驗結果錶明,P-Stream具有良好的聚類質量、較快的處理速度,能夠有效地適應數據縯化情況.
제출-충재개솔수거류상진행취류적유효방법P-Stream.P-Stream침대수거류상적개솔원조제출강족、과도족화약족적개념,설계-충유효적재선후선족선택책략,위매개불단도체적수거원조합리지조도가능귀속적족,병재매개검사점존저미족쾌조,이편리선진-보고층취류화연화분석.최후설계-개"적겁"적이층취류모형래판단현유적제1층취류모형시부환괄응수거류중최근도체적개솔원조.실험채용KDD-CUP'98화KDD-CUP'99진실수거집이급변환고사분포적인공수거집구조개솔수거류.실험결과표명,P-Stream구유량호적취류질량、교쾌적처리속도,능구유효지괄응수거연화정황.