计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
z1期
406-408,420
,共4页
K-means算法%初始质心%空间距离差%噪声数据
K-means算法%初始質心%空間距離差%譟聲數據
K-means산법%초시질심%공간거리차%조성수거
K-means algorithm%Initial centroid%Spatial distance difference%Noisy data
K-means算法由于其固有的初始聚类质心敏感性,存在聚类结果不稳定、容易收敛到局部最优等问题.现有改进方案在处理无噪数据集时能够在降低迭代次数的同时得到近似全局最优解,但在处理有噪数据集时容易陷入局部最优,甚至聚类效果低于传统的K-means算法.在最远空间距离确定初始质心算法的基础上,提出一种基于空间距离差的初始质心选择算法.该算法的核心思想是通过计算非聚类质心点到已选质心的距离和,并排序,选取相邻距离差最大的两点中靠近已知质心的点作为下一个簇的初始质心而实现的.实验结果表明,所提算法在聚类迭代次数相当的情况下,对不合噪声数据集的聚类准确度增加约1%,对于含有噪声的数据集,聚类准确度达到90%以上.
K-means算法由于其固有的初始聚類質心敏感性,存在聚類結果不穩定、容易收斂到跼部最優等問題.現有改進方案在處理無譟數據集時能夠在降低迭代次數的同時得到近似全跼最優解,但在處理有譟數據集時容易陷入跼部最優,甚至聚類效果低于傳統的K-means算法.在最遠空間距離確定初始質心算法的基礎上,提齣一種基于空間距離差的初始質心選擇算法.該算法的覈心思想是通過計算非聚類質心點到已選質心的距離和,併排序,選取相鄰距離差最大的兩點中靠近已知質心的點作為下一箇簇的初始質心而實現的.實驗結果錶明,所提算法在聚類迭代次數相噹的情況下,對不閤譟聲數據集的聚類準確度增加約1%,對于含有譟聲的數據集,聚類準確度達到90%以上.
K-means산법유우기고유적초시취류질심민감성,존재취류결과불은정、용역수렴도국부최우등문제.현유개진방안재처리무조수거집시능구재강저질대차수적동시득도근사전국최우해,단재처리유조수거집시용역함입국부최우,심지취류효과저우전통적K-means산법.재최원공간거리학정초시질심산법적기출상,제출일충기우공간거리차적초시질심선택산법.해산법적핵심사상시통과계산비취류질심점도이선질심적거리화,병배서,선취상린거리차최대적량점중고근이지질심적점작위하일개족적초시질심이실현적.실험결과표명,소제산법재취류질대차수상당적정황하,대불합조성수거집적취류준학도증가약1%,대우함유조성적수거집,취류준학도체도90%이상.