微型机与应用
微型機與應用
미형궤여응용
Microcomputer & its Applications
2015年
19期
17-19,23
,共4页
聚类%K-means 算法%密度%聚类中心%噪声点
聚類%K-means 算法%密度%聚類中心%譟聲點
취류%K-means 산법%밀도%취류중심%조성점
clustering%K-means algorithm%density%clustering center%noise points
传统的 K-means 算法随机选取初始聚类中心,聚类结果不稳定,容易陷入局部最优解。针对聚类中心的敏感性,提出一种优化初始聚类中心的 K-means 算法。此算法利用数据集样本的分布特征计算样本点的密度并进行分类,在高密度区域中选择 K 个密度最大且相互距离超过某特定阈值的点作为初始聚类中心,并对低密度区域的噪声点单独处理。实验证明,优化后的算法能取得更好的聚类效果,且稳定性增强。
傳統的 K-means 算法隨機選取初始聚類中心,聚類結果不穩定,容易陷入跼部最優解。針對聚類中心的敏感性,提齣一種優化初始聚類中心的 K-means 算法。此算法利用數據集樣本的分佈特徵計算樣本點的密度併進行分類,在高密度區域中選擇 K 箇密度最大且相互距離超過某特定閾值的點作為初始聚類中心,併對低密度區域的譟聲點單獨處理。實驗證明,優化後的算法能取得更好的聚類效果,且穩定性增彊。
전통적 K-means 산법수궤선취초시취류중심,취류결과불은정,용역함입국부최우해。침대취류중심적민감성,제출일충우화초시취류중심적 K-means 산법。차산법이용수거집양본적분포특정계산양본점적밀도병진행분류,재고밀도구역중선택 K 개밀도최대차상호거리초과모특정역치적점작위초시취류중심,병대저밀도구역적조성점단독처리。실험증명,우화후적산법능취득경호적취류효과,차은정성증강。
Aiming at the problem of the traditional K-means algorithm which generate its initial centers randomly from the data set, a method is proposed to optimize the initial center points through computing the density of objects. The algorithm computes the density of the area where the object belongs to, and then select K objects as the initial centers which has the highest density and has threshold distance to each other in high-density region. Also, the noise points in low-density region are treated separately. The experimental results demonstrate that the improved algorithm can get better clustering, and eliminate the sensitivity to the initial start centers.