计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2015年
z1期
18-21
,共4页
拉普拉斯矩阵%聚类%K-means%降维%社团挖掘
拉普拉斯矩陣%聚類%K-means%降維%社糰挖掘
랍보랍사구진%취류%K-means%강유%사단알굴
Laplacian matrix%clustering%K-means%dimensionality reduction%communities detection
针对K平均( K-means)、期望最大化( EM)等传统聚类算法在网络社团挖掘中存在的聚类结果不合理、容易陷入局部最小值等问题,以最小化社团间的连接权值为优化目标,基于节点间交互次数归一化结果建立节点间的相似矩阵,求出此矩阵对应的拉普拉斯矩阵,以拉普拉斯矩阵的前k个最小特征值对应的特征向量为基建立新的特征空间,将相似矩阵向新的特征空间做投影,在投影后的特征空间中运用K-means算法进行社团挖掘,实现目标函数的最小化。通过仿真实验对比,说明了该基于拉普拉斯矩阵的聚类方法( LMBC)比传统聚类方法更有效地解决聚类节点分布不均衡的问题,及非凸、高维数据集在保持原有几何结构的同时有效降维的问题。 LMBC从数据集相似矩阵的角度进行聚类分析,进一步丰富了流形学习的理论与方法,可广泛应用于社交网络分析及图像识别等领域。
針對K平均( K-means)、期望最大化( EM)等傳統聚類算法在網絡社糰挖掘中存在的聚類結果不閤理、容易陷入跼部最小值等問題,以最小化社糰間的連接權值為優化目標,基于節點間交互次數歸一化結果建立節點間的相似矩陣,求齣此矩陣對應的拉普拉斯矩陣,以拉普拉斯矩陣的前k箇最小特徵值對應的特徵嚮量為基建立新的特徵空間,將相似矩陣嚮新的特徵空間做投影,在投影後的特徵空間中運用K-means算法進行社糰挖掘,實現目標函數的最小化。通過倣真實驗對比,說明瞭該基于拉普拉斯矩陣的聚類方法( LMBC)比傳統聚類方法更有效地解決聚類節點分佈不均衡的問題,及非凸、高維數據集在保持原有幾何結構的同時有效降維的問題。 LMBC從數據集相似矩陣的角度進行聚類分析,進一步豐富瞭流形學習的理論與方法,可廣汎應用于社交網絡分析及圖像識彆等領域。
침대K평균( K-means)、기망최대화( EM)등전통취류산법재망락사단알굴중존재적취류결과불합리、용역함입국부최소치등문제,이최소화사단간적련접권치위우화목표,기우절점간교호차수귀일화결과건립절점간적상사구진,구출차구진대응적랍보랍사구진,이랍보랍사구진적전k개최소특정치대응적특정향량위기건립신적특정공간,장상사구진향신적특정공간주투영,재투영후적특정공간중운용K-means산법진행사단알굴,실현목표함수적최소화。통과방진실험대비,설명료해기우랍보랍사구진적취류방법( LMBC)비전통취류방법경유효지해결취류절점분포불균형적문제,급비철、고유수거집재보지원유궤하결구적동시유효강유적문제。 LMBC종수거집상사구진적각도진행취류분석,진일보봉부료류형학습적이론여방법,가엄범응용우사교망락분석급도상식별등영역。
In view of problems on unreasonable clustering result and easy to fall into local minimum of traditional clustering algorithms, i. e. K-means, Expectation Maximitation ( EM) when they are applied to communities detection, in this study an different approach was proposed. It set minimizing the link weights between different communities as the optimization objective, built a similarity matrix based on normalization result of interaction times between network nodes, inferred the corresponding Laplacian matrix of this similarity matrix, established a new eigenspace based on the corresponding eigenvectors of the first k smallest eigenvalues, made a projection of the similarity matrix on the new eigenspace, did clustering on the projection eigenspace by K-means, finally, accomplished the minimization of objective function. Simulation experiment was done to illustrate that Laplacian Matrix Based Clustering ( LMBC ) can effectively resolve the problems of unbalancing distribution of network nodes and dimensionality reduction of non-convex high dimensional dataset while keeping the geometric structure. LMBC enriches the manifold learning theory and methodology by doing clustering on the dataset similarity matrix, and it can be widely used in social network analysis and image recognition areas.