计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2006年
11期
2005-2011
,共7页
周晓云%孙志挥%张柏礼%杨宜东
週曉雲%孫誌揮%張柏禮%楊宜東
주효운%손지휘%장백례%양의동
数据流%聚类分析%改进金字塔时间结构%演化分析
數據流%聚類分析%改進金字塔時間結構%縯化分析
수거류%취류분석%개진금자탑시간결구%연화분석
基于数据流数据的聚类分析算法已成为研究的热点.提出一种基于子空间的高维数据流聚类及演化分析算法CAStream,该算法对数据空间进行网格化,采用近似的方法记录网格单元的统计信息,并将潜在密集网格单元快照以改进的金字塔时间结构进行存储,最后采用深度优先搜索方法进行聚类及其演化分析. CAStream能够有效处理高维数据流,并能发现任意形状分布的聚类.基于真实数据集与仿真数据集的实验表明,算法具有良好的适用性和有效性.
基于數據流數據的聚類分析算法已成為研究的熱點.提齣一種基于子空間的高維數據流聚類及縯化分析算法CAStream,該算法對數據空間進行網格化,採用近似的方法記錄網格單元的統計信息,併將潛在密集網格單元快照以改進的金字塔時間結構進行存儲,最後採用深度優先搜索方法進行聚類及其縯化分析. CAStream能夠有效處理高維數據流,併能髮現任意形狀分佈的聚類.基于真實數據集與倣真數據集的實驗錶明,算法具有良好的適用性和有效性.
기우수거류수거적취류분석산법이성위연구적열점.제출일충기우자공간적고유수거류취류급연화분석산법CAStream,해산법대수거공간진행망격화,채용근사적방법기록망격단원적통계신식,병장잠재밀집망격단원쾌조이개진적금자탑시간결구진행존저,최후채용심도우선수색방법진행취류급기연화분석. CAStream능구유효처리고유수거류,병능발현임의형상분포적취류.기우진실수거집여방진수거집적실험표명,산법구유량호적괄용성화유효성.