计算机应用与软件
計算機應用與軟件
계산궤응용여연건
Computer Applications and Software
2015年
10期
265-268
,共4页
抗噪%聚类%KD 树%密度%质心
抗譟%聚類%KD 樹%密度%質心
항조%취류%KD 수%밀도%질심
Noise proof%Clustering%KD-tree%Density%Centroid
K-means 作为经典的聚类算法,对噪音很敏感。在实际应用中,数据通常包含较多噪音,聚类难以得到良好的效果。提出一种含噪音处理的 K-means 聚类算法。算法将原空间动态地划分成若干个区域,利用对应的区域密度加权计算样本与每个区域质心的相似度矩阵,作为 K-means 的输入。该矩阵有效描述了数据的分布信息,同时实现了特征的降维,能更有效处理带噪音数据的聚类任务,更适用于数据分布复杂的情况。实验结果证实了此算法的有效性。
K-means 作為經典的聚類算法,對譟音很敏感。在實際應用中,數據通常包含較多譟音,聚類難以得到良好的效果。提齣一種含譟音處理的 K-means 聚類算法。算法將原空間動態地劃分成若榦箇區域,利用對應的區域密度加權計算樣本與每箇區域質心的相似度矩陣,作為 K-means 的輸入。該矩陣有效描述瞭數據的分佈信息,同時實現瞭特徵的降維,能更有效處理帶譟音數據的聚類任務,更適用于數據分佈複雜的情況。實驗結果證實瞭此算法的有效性。
K-means 작위경전적취류산법,대조음흔민감。재실제응용중,수거통상포함교다조음,취류난이득도량호적효과。제출일충함조음처리적 K-means 취류산법。산법장원공간동태지화분성약간개구역,이용대응적구역밀도가권계산양본여매개구역질심적상사도구진,작위 K-means 적수입。해구진유효묘술료수거적분포신식,동시실현료특정적강유,능경유효처리대조음수거적취류임무,경괄용우수거분포복잡적정황。실험결과증실료차산법적유효성。
K-means clustering as classical clustering algorithm is sensitive to noise.In practical applications,the data usually contain many noises and this makes it difficult to obtain a good clustering result.This paper proposes a K-means clustering algorithm with noise pro-cessing.The algorithm divides original space to several regions dynamically,and calculates the weighted similarity matrix of sample and each regional centroid using correlated regional density and uses it as the input of K-means algorithm.The matrix effectively describes the distribu-tion information of data and at the same time realises the dimensionality reduction of features so that the clustering tasks with noise data can be processed more effectively.The proposed algorithm is more suitable for the situation of complex data distribution.Experimental result proves the effectiveness of the algorithm.