计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2006年
5期
834-840
,共7页
周晓云%孙志挥%张柏礼%杨宜东
週曉雲%孫誌揮%張柏禮%楊宜東
주효운%손지휘%장백례%양의동
数据流%聚类算法%子空间聚类%Hoeffding界
數據流%聚類算法%子空間聚類%Hoeffding界
수거류%취류산법%자공간취류%Hoeffding계
近年来由于数据流应用的大量涌现,基于数据流模型的数据挖掘算法研究已成为重要的应用前沿课题.提出一种基于Hoeffding界的高维数据流的子空间聚类发现及维护算法--SHStream.算法将数据流分段(分段长度由Hoeffding界确定),在数据分段上进行子空间聚类,通过迭代逐步得到满足聚类精度要求的聚类结果,同时针对数据流的动态性,算法对聚类结果进行调整和维护.算法可以有效地处理高雏数据流和对任意形状分布数据的聚类问题.基于真实数据集与仿真数据集的实验表明,算法具有良好的适用性和有效性.
近年來由于數據流應用的大量湧現,基于數據流模型的數據挖掘算法研究已成為重要的應用前沿課題.提齣一種基于Hoeffding界的高維數據流的子空間聚類髮現及維護算法--SHStream.算法將數據流分段(分段長度由Hoeffding界確定),在數據分段上進行子空間聚類,通過迭代逐步得到滿足聚類精度要求的聚類結果,同時針對數據流的動態性,算法對聚類結果進行調整和維護.算法可以有效地處理高雛數據流和對任意形狀分佈數據的聚類問題.基于真實數據集與倣真數據集的實驗錶明,算法具有良好的適用性和有效性.
근년래유우수거류응용적대량용현,기우수거류모형적수거알굴산법연구이성위중요적응용전연과제.제출일충기우Hoeffding계적고유수거류적자공간취류발현급유호산법--SHStream.산법장수거류분단(분단장도유Hoeffding계학정),재수거분단상진행자공간취류,통과질대축보득도만족취류정도요구적취류결과,동시침대수거류적동태성,산법대취류결과진행조정화유호.산법가이유효지처리고추수거류화대임의형상분포수거적취류문제.기우진실수거집여방진수거집적실험표명,산법구유량호적괄용성화유효성.