西南交通大学学报
西南交通大學學報
서남교통대학학보
JOURNAL OF SOUTHWEST JIAOTONG UNIVERSITY
2009年
4期
490-494
,共5页
数据流聚类%密度簇参考点%k-均值参考点
數據流聚類%密度簇參攷點%k-均值參攷點
수거류취류%밀도족삼고점%k-균치삼고점
为提高数据分布不规则和含有噪音时的数据流聚类质量,提出了一种有效的数据流二次聚类算法TCLUSA.该算法基于分区思想,采用DBSCAN方法对每块分区进行聚类,以得到的簇的均值点作为其代表点,再用k-means对所获得的代表点进行聚类,算法采用分层结构保存每次聚类获得的簇参考点,直至获得最终结果.理论分析和实验结果表明,TCLUSA算法能有效提高数据流的聚类质量.
為提高數據分佈不規則和含有譟音時的數據流聚類質量,提齣瞭一種有效的數據流二次聚類算法TCLUSA.該算法基于分區思想,採用DBSCAN方法對每塊分區進行聚類,以得到的簇的均值點作為其代錶點,再用k-means對所穫得的代錶點進行聚類,算法採用分層結構保存每次聚類穫得的簇參攷點,直至穫得最終結果.理論分析和實驗結果錶明,TCLUSA算法能有效提高數據流的聚類質量.
위제고수거분포불규칙화함유조음시적수거류취류질량,제출료일충유효적수거류이차취류산법TCLUSA.해산법기우분구사상,채용DBSCAN방법대매괴분구진행취류,이득도적족적균치점작위기대표점,재용k-means대소획득적대표점진행취류,산법채용분층결구보존매차취류획득적족삼고점,직지획득최종결과.이론분석화실험결과표명,TCLUSA산법능유효제고수거류적취류질량.