计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2013年
14期
182-185,192
,共5页
冯波%郝文宁%陈刚%占栋辉
馮波%郝文寧%陳剛%佔棟輝
풍파%학문저%진강%점동휘
K-means算法%聚类%初始聚类中心%TDKM算法
K-means算法%聚類%初始聚類中心%TDKM算法
K-means산법%취류%초시취류중심%TDKM산법
K-means algorithm%clustering%initial clustering centers%TDKM algorithm
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。
針對傳統K-means算法對初始聚類中心敏感的問題,提齣瞭基于數據樣本分佈情況的動態選取初始聚類中心的改進K-means算法。該算法根據數據點的距離構造最小生成樹,併對最小生成樹進行剪枝得到K箇初始數據集閤,得到初始的聚類中心。由此得到的初始聚類中心非常地接近迭代聚類算法收斂的聚類中心。理論分析與實驗錶明,改進的K-means算法能改善算法的聚類性能,減少聚類的迭代次數,提高效率,併能得到穩定的聚類結果,取得較高的分類準確率。
침대전통K-means산법대초시취류중심민감적문제,제출료기우수거양본분포정황적동태선취초시취류중심적개진K-means산법。해산법근거수거점적거리구조최소생성수,병대최소생성수진행전지득도K개초시수거집합,득도초시적취류중심。유차득도적초시취류중심비상지접근질대취류산법수렴적취류중심。이론분석여실험표명,개진적K-means산법능개선산법적취류성능,감소취류적질대차수,제고효솔,병능득도은정적취류결과,취득교고적분류준학솔。
To solve this problems that the traditional K-means algorithm has sensitivity to the initial cluster centers, a new improved K-means algorithm is proposed. The algorithm builds minimum spanning tree and then splits it to get K initial clusters and the relevant initial cluster centers. The initial cluster centers are found to be very closed to the desired cluster centers for iterative clustering algorithms. Theory analysis and experimental results demonstrate that the improved algorithms can enhance the clus-tering performance, get stable clustering in a higher accuracy.