新型工业化
新型工業化
신형공업화
New Industrialization Straregy
2011年
5期
90-94
,共5页
K均值聚类%初始聚类中心%数据点划分%距离%边缘数据
K均值聚類%初始聚類中心%數據點劃分%距離%邊緣數據
K균치취류%초시취류중심%수거점화분%거리%변연수거
K-means clustering%initial clustering centre%points division%distance%edge data
传统K均值聚类算法随机选取初始中心容易陷入局部极小,而且不能有效处理不规则数据集的边缘数据。针对这两个问题,提出一种改进K均值聚类算法。初始聚类中心的选取使用基于距离的方法,减少了迭代次数;数据点不再根据距离聚类中心的大小划分,而是根据其周围点的分布划分。通过仿真,证实了本文算法的可行性与有效性。
傳統K均值聚類算法隨機選取初始中心容易陷入跼部極小,而且不能有效處理不規則數據集的邊緣數據。針對這兩箇問題,提齣一種改進K均值聚類算法。初始聚類中心的選取使用基于距離的方法,減少瞭迭代次數;數據點不再根據距離聚類中心的大小劃分,而是根據其週圍點的分佈劃分。通過倣真,證實瞭本文算法的可行性與有效性。
전통K균치취류산법수궤선취초시중심용역함입국부겁소,이차불능유효처리불규칙수거집적변연수거。침대저량개문제,제출일충개진K균치취류산법。초시취류중심적선취사용기우거리적방법,감소료질대차수;수거점불재근거거리취류중심적대소화분,이시근거기주위점적분포화분。통과방진,증실료본문산법적가행성여유효성。
Traditional K-means clustering algorithm is easy to fall into local minimum for its initial center points selected randomly, and cannot deal with the point which is on the edge of the irregular data set effectively. Considering these, we propose a improved k-means clustering algorithm in this paper. The new selection of the initial centers, which is based on the distance of the points, can reduce the number of iterations; the points are divided by the distribution of the points around, instead of the distance from the associated class center. Through the simulation experiments, we prove the feasibility and effectiveness of the proposed algorithm.