计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2014年
4期
178-181,192
,共5页
聚类%K 均值%初始化%近邻图
聚類%K 均值%初始化%近鄰圖
취류%K 균치%초시화%근린도
Clustering%k-means%Initialisation%Neighbourhood graph
k-means 算法以其算法简单、计算效率高而被广泛应用在数据挖掘、机器学习、计算机视觉等领域。然而,k-means 算法的性能严重依赖于其初始聚类中心的选取。不同的初始聚类中心导致 k-means 算法的聚类结果变化很大。一个合理的方式是选取处在数据相对密集区域的数据样本作为初始聚类中心。鉴于此,提出一种基于数据近邻图的 k-means 初始中心选取算法。该算法分为三个阶段:1)构建数据集的局部近邻图;2)选取初始聚类中心的候选集合;3)确定恰当的初始聚类中心。实验结果表明,该算法选取的初始聚类中心是合理的,同时,可以加快 k-means 的收敛速度。
k-means 算法以其算法簡單、計算效率高而被廣汎應用在數據挖掘、機器學習、計算機視覺等領域。然而,k-means 算法的性能嚴重依賴于其初始聚類中心的選取。不同的初始聚類中心導緻 k-means 算法的聚類結果變化很大。一箇閤理的方式是選取處在數據相對密集區域的數據樣本作為初始聚類中心。鑒于此,提齣一種基于數據近鄰圖的 k-means 初始中心選取算法。該算法分為三箇階段:1)構建數據集的跼部近鄰圖;2)選取初始聚類中心的候選集閤;3)確定恰噹的初始聚類中心。實驗結果錶明,該算法選取的初始聚類中心是閤理的,同時,可以加快 k-means 的收斂速度。
k-means 산법이기산법간단、계산효솔고이피엄범응용재수거알굴、궤기학습、계산궤시각등영역。연이,k-means 산법적성능엄중의뢰우기초시취류중심적선취。불동적초시취류중심도치 k-means 산법적취류결과변화흔대。일개합리적방식시선취처재수거상대밀집구역적수거양본작위초시취류중심。감우차,제출일충기우수거근린도적 k-means 초시중심선취산법。해산법분위삼개계단:1)구건수거집적국부근린도;2)선취초시취류중심적후선집합;3)학정흡당적초시취류중심。실험결과표명,해산법선취적초시취류중심시합리적,동시,가이가쾌 k-means 적수렴속도。
K-means clustering algorithm is widely used in the fields of data mining,machine learning and computer vision for its conceptually simplicity and high computation efficiency.However,its performance severely relies on the initial clustering centre selection.Differentinitial cluste-ring centre results in the clustering results of k-means algorithm sharply varying.A reasonable solution is to choose the data sample in the region with relative dense data as the initial clustering centre.In view of this,we propose a data neighbourhood graph-basedinitial centre selection method for k-means algorithm,which takes three steps.The first step is to construct the neighbourhood graph of the dataset.The second step is to choose candidates collection of initial clustering centres.The last step is to decide appropriate initialclustering centre.Experimental results show that the initial clustering centre chosen by the proposed method is reasonable,and can speed up the convergence of k-means at the same time.