现代计算机(普及版)
現代計算機(普及版)
현대계산궤(보급판)
MODERN COMPUTER
2014年
1期
15-18
,共4页
密度阈值%阶段聚类%密度因子%距离阈值%孤立点
密度閾值%階段聚類%密度因子%距離閾值%孤立點
밀도역치%계단취류%밀도인자%거리역치%고립점
Density Threshold%Multi-Stage Clustering%Density Factor%Distance Threshold%Outlier
随着聚类技术的发展,对不同密度的数据集的聚类需求也越来越迫切。为了解决不同密度数据集的聚类问题,提出一种基于距离和密度的多阶段聚类算法MCDD。该算法主要采用多阶段密度处理技术提取不同密度的聚类,同时使用密度因子提高聚类的精度,最后通过使用距离阈值的方法去除孤立点和噪声数据。实验表明,该算法在扩展性方面表现良好,对任意形状和大小的聚类都可以很好地处理,并能够很好地识别出孤立点或噪声,在处理多密度聚类方面有很好的精度。
隨著聚類技術的髮展,對不同密度的數據集的聚類需求也越來越迫切。為瞭解決不同密度數據集的聚類問題,提齣一種基于距離和密度的多階段聚類算法MCDD。該算法主要採用多階段密度處理技術提取不同密度的聚類,同時使用密度因子提高聚類的精度,最後通過使用距離閾值的方法去除孤立點和譟聲數據。實驗錶明,該算法在擴展性方麵錶現良好,對任意形狀和大小的聚類都可以很好地處理,併能夠很好地識彆齣孤立點或譟聲,在處理多密度聚類方麵有很好的精度。
수착취류기술적발전,대불동밀도적수거집적취류수구야월래월박절。위료해결불동밀도수거집적취류문제,제출일충기우거리화밀도적다계단취류산법MCDD。해산법주요채용다계단밀도처리기술제취불동밀도적취류,동시사용밀도인자제고취류적정도,최후통과사용거리역치적방법거제고립점화조성수거。실험표명,해산법재확전성방면표현량호,대임의형상화대소적취류도가이흔호지처리,병능구흔호지식별출고립점혹조성,재처리다밀도취류방면유흔호적정도。
With the development of clustering technology, the demand of clustering of different density data sets is more and more urgent. In order to solve the clustering problem of different density data sets, proposes a multi-stage clustering algorithm based on distance and density (MCDD). The algorithm adopts multi-stage density processing technology to extract clustering of different density, while using the density factor to improve the precision of clustering, removes the outlier and noise data by using the distance threshold method. Scanning the dataset only once, the MCDD can discover clusters of arbitrary shapes. The experiment results show that it can discover outliers or noises effectively and get good cluster quality for multi-density data sets.