计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2014年
1期
88-95
,共8页
于翔%印桂生%许宪东%王建伟
于翔%印桂生%許憲東%王建偉
우상%인계생%허헌동%왕건위
数据挖掘%数据流%子空间聚类%特征选择%维度约简
數據挖掘%數據流%子空間聚類%特徵選擇%維度約簡
수거알굴%수거류%자공간취류%특정선택%유도약간
data mining%data stream%subspace clustering%feature selection%dimension reduction
数据流子空间聚类的主要目的是在合理的时间段内准确找到数据流特征子空间中的聚类.现有的数据流子空间聚类算法受参数影响较大,通常要求预先给出聚类数目或特征子空间,且聚类结果不能及时反映数据流的变化情况.针对以上缺陷,提出一种新的数据流子空间聚类算法SC-RP,SC-RP无需预先给出聚类数目或特征子空间,对孤立点不敏感,可实现快速聚类,通过区域树结构记录数据流的变化并及时更新统计信息,进而根据数据流的变化调整聚类结果.通过在真实数据集与仿真数据集上的实验,证明了SC-RP在聚类精度和速度上优于现有的数据流子空间聚类算法,且对聚类数目及数据维度均具有良好的伸缩性.
數據流子空間聚類的主要目的是在閤理的時間段內準確找到數據流特徵子空間中的聚類.現有的數據流子空間聚類算法受參數影響較大,通常要求預先給齣聚類數目或特徵子空間,且聚類結果不能及時反映數據流的變化情況.針對以上缺陷,提齣一種新的數據流子空間聚類算法SC-RP,SC-RP無需預先給齣聚類數目或特徵子空間,對孤立點不敏感,可實現快速聚類,通過區域樹結構記錄數據流的變化併及時更新統計信息,進而根據數據流的變化調整聚類結果.通過在真實數據集與倣真數據集上的實驗,證明瞭SC-RP在聚類精度和速度上優于現有的數據流子空間聚類算法,且對聚類數目及數據維度均具有良好的伸縮性.
수거류자공간취류적주요목적시재합리적시간단내준학조도수거류특정자공간중적취류.현유적수거류자공간취류산법수삼수영향교대,통상요구예선급출취류수목혹특정자공간,차취류결과불능급시반영수거류적변화정황.침대이상결함,제출일충신적수거류자공간취류산법SC-RP,SC-RP무수예선급출취류수목혹특정자공간,대고립점불민감,가실현쾌속취류,통과구역수결구기록수거류적변화병급시경신통계신식,진이근거수거류적변화조정취류결과.통과재진실수거집여방진수거집상적실험,증명료SC-RP재취류정도화속도상우우현유적수거류자공간취류산법,차대취류수목급수거유도균구유량호적신축성.