电子设计工程
電子設計工程
전자설계공정
ELECTRONIC DESIGN ENGINEERING
2012年
22期
86-88
,共3页
数据挖掘%算法%欧氏距离%K均值聚类分析
數據挖掘%算法%歐氏距離%K均值聚類分析
수거알굴%산법%구씨거리%K균치취류분석
data mining%algorithm%Euclidean distance%K-means clustering analysis
针对传统的K均值聚类分析,不考虑对象中每个变量在聚类过程中体现作用的不同,而是统一看待,用这样计算的距离来表示两个对象的相似度并不确切。文中提出了一种基于距离度量的聚类算法,算法使用新的距离度量代替了K均值聚类算法的欧式距离,应用新的距离度量之后,数据点的权重不再只为1或0,而是由系数来确定,这就将硬划分转化为软划分。最后经过实验证明了改进的聚类算法比传统的K均值聚类收敛速度有了很大提高。提高了算法的执行效率。
針對傳統的K均值聚類分析,不攷慮對象中每箇變量在聚類過程中體現作用的不同,而是統一看待,用這樣計算的距離來錶示兩箇對象的相似度併不確切。文中提齣瞭一種基于距離度量的聚類算法,算法使用新的距離度量代替瞭K均值聚類算法的歐式距離,應用新的距離度量之後,數據點的權重不再隻為1或0,而是由繫數來確定,這就將硬劃分轉化為軟劃分。最後經過實驗證明瞭改進的聚類算法比傳統的K均值聚類收斂速度有瞭很大提高。提高瞭算法的執行效率。
침대전통적K균치취류분석,불고필대상중매개변량재취류과정중체현작용적불동,이시통일간대,용저양계산적거리래표시량개대상적상사도병불학절。문중제출료일충기우거리도량적취류산법,산법사용신적거리도량대체료K균치취류산법적구식거리,응용신적거리도량지후,수거점적권중불재지위1혹0,이시유계수래학정,저취장경화분전화위연화분。최후경과실험증명료개진적취류산법비전통적K균치취류수렴속도유료흔대제고。제고료산법적집행효솔。
Traditional K-means clustering analysis does not consider the different objects in each variable to reflect the role of the clustering process, but a unified look at the distance calculated in this way to represent the similarity between two objects is not exact. This paper presents a clustering algorithm based on distance metric, the algorithm uses a new distance metric instead of Euclidean distance of the K-means clustering algorithm, and apply the new distance measure, the data points in the right weight is no longer only for 1 or 0, while determinect by the coefficient, which will be hard to divide into soft division. The experiments show that the improved clustering algorithm has been greatly improved convergence rate than the traditional K-means clustering to improve the efficiency of the implementation of the algorithm.