测绘工程
測繪工程
측회공정
ENGINEERING OF SURVEYING AND MAPPING
2015年
5期
42-46
,共5页
江京亚%郭庆胜%陈旺%周贺杰%陈勇
江京亞%郭慶勝%陳旺%週賀傑%陳勇
강경아%곽경성%진왕%주하걸%진용
数据挖掘%K-均值聚类%第4邻近距离图%初始簇中心%噪声点
數據挖掘%K-均值聚類%第4鄰近距離圖%初始簇中心%譟聲點
수거알굴%K-균치취류%제4린근거리도%초시족중심%조성점
data mining%K-means algorithm%4-dist Graph%initial clustering center%noise points
由于传统的K-均值聚类算法固有的特性,如对初始聚类中心的依赖性和对噪声点的敏感性,导致了其聚类结果的不稳定。文中基于 k-dist图提出一种改进算法,算法首先去除数据集中的噪声点,然后从数据集中选取靠近点聚集区域、相距最远的 k′个数据点作为初始簇中心。实验结果证明,文中算法能够很好地消除K-均值聚类算法对初始簇中心的依赖性,并能有效去除噪声点。
由于傳統的K-均值聚類算法固有的特性,如對初始聚類中心的依賴性和對譟聲點的敏感性,導緻瞭其聚類結果的不穩定。文中基于 k-dist圖提齣一種改進算法,算法首先去除數據集中的譟聲點,然後從數據集中選取靠近點聚集區域、相距最遠的 k′箇數據點作為初始簇中心。實驗結果證明,文中算法能夠很好地消除K-均值聚類算法對初始簇中心的依賴性,併能有效去除譟聲點。
유우전통적K-균치취류산법고유적특성,여대초시취류중심적의뢰성화대조성점적민감성,도치료기취류결과적불은정。문중기우 k-dist도제출일충개진산법,산법수선거제수거집중적조성점,연후종수거집중선취고근점취집구역、상거최원적 k′개수거점작위초시족중심。실험결과증명,문중산법능구흔호지소제K-균치취류산법대초시족중심적의뢰성,병능유효거제조성점。
Because of the inherent characteristics of the traditional K‐means algorithm ,such as the dependence of the initial clustering center and the sensitivity to noise points ,it is easy to generate the instable clustering results .An improved algorithm is proposed based on the k‐dist graph .The algorithm first removes the noise points of the data set ,and then selects k′initial center ,w hich is close to the point gathering area and far away from each other .The experimental results show that the algorithm can eliminate its dependence of the initial center as well as removing the noise points effectively .