计算机应用
計算機應用
계산궤응용
Journal of Computer Applications
2015年
7期
1927-1932,1949
,共7页
离群点%数据流聚类%近邻传播%微簇
離群點%數據流聚類%近鄰傳播%微簇
리군점%수거류취류%근린전파%미족
outlier%data stream clustering%Affinity Propagation (AP)%micro-cluster
针对目前数据流离群点不能很好地被处理、数据流聚类效率较低以及对数据流的动态变化不能实时检测等问题,提出一种基于近邻传播与密度相融合的进化数据流聚类算法(I-APDenStream).此算法使用传统的两阶段处理模型,即在线与离线聚类两部分.不仅引进了能够体现数据流动态变化的微簇衰减密度以及在线动态维护微簇的删减机制,而且在对模型采用扩展的加权近邻传播(WAP)聚类进行模型重建时,还引进了异常点检测删除机制.通过在两种类型数据集上的实验结果表明,所提算法的聚类准确率基本能保持在95%以上,其纯度对比实验等其他相关测试都有较好结果,能够高实效、高质量、高效率地处理数据流数据聚类.
針對目前數據流離群點不能很好地被處理、數據流聚類效率較低以及對數據流的動態變化不能實時檢測等問題,提齣一種基于近鄰傳播與密度相融閤的進化數據流聚類算法(I-APDenStream).此算法使用傳統的兩階段處理模型,即在線與離線聚類兩部分.不僅引進瞭能夠體現數據流動態變化的微簇衰減密度以及在線動態維護微簇的刪減機製,而且在對模型採用擴展的加權近鄰傳播(WAP)聚類進行模型重建時,還引進瞭異常點檢測刪除機製.通過在兩種類型數據集上的實驗結果錶明,所提算法的聚類準確率基本能保持在95%以上,其純度對比實驗等其他相關測試都有較好結果,能夠高實效、高質量、高效率地處理數據流數據聚類.
침대목전수거류리군점불능흔호지피처리、수거류취류효솔교저이급대수거류적동태변화불능실시검측등문제,제출일충기우근린전파여밀도상융합적진화수거류취류산법(I-APDenStream).차산법사용전통적량계단처리모형,즉재선여리선취류량부분.불부인진료능구체현수거류동태변화적미족쇠감밀도이급재선동태유호미족적산감궤제,이차재대모형채용확전적가권근린전파(WAP)취류진행모형중건시,환인진료이상점검측산제궤제.통과재량충류형수거집상적실험결과표명,소제산법적취류준학솔기본능보지재95%이상,기순도대비실험등기타상관측시도유교호결과,능구고실효、고질량、고효솔지처리수거류수거취류.