计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2014年
3期
185-188,192
,共5页
刘晓楠%尹美娟%李明涛%姚东%陈武平
劉曉楠%尹美娟%李明濤%姚東%陳武平
류효남%윤미연%리명도%요동%진무평
数据聚类%近邻传播%分层推举%聚类中心
數據聚類%近鄰傳播%分層推舉%聚類中心
수거취류%근린전파%분층추거%취류중심
Data clustering%Affinity propagation%Hierarchical selecting%Clustering center
近邻传播(Affinity Propagation,AP)聚类具有不需要设定聚类个数、快速准确的优点,但无法适应于大规模数据的应用需求.针对此问题,提出了分层近邻传播聚类算法.首先,将待聚类数据集划分为若干适合AP算法高效执行的子集,分别推举出各个子集的聚类中心;然后对所有子集聚类中心再次执行AP聚类,推举出整个数据集的全局聚类中心;最后根据与这些全局聚类中心的相似度对聚类样本进行划分,从而实现对大规模数据的高效聚类.在真实和模拟数据集上的实验结果均表明,与AP聚类和自适应AP聚类相比,该方法在保证较好聚类效果的同时,极大地降低了聚类的时间消耗.
近鄰傳播(Affinity Propagation,AP)聚類具有不需要設定聚類箇數、快速準確的優點,但無法適應于大規模數據的應用需求.針對此問題,提齣瞭分層近鄰傳播聚類算法.首先,將待聚類數據集劃分為若榦適閤AP算法高效執行的子集,分彆推舉齣各箇子集的聚類中心;然後對所有子集聚類中心再次執行AP聚類,推舉齣整箇數據集的全跼聚類中心;最後根據與這些全跼聚類中心的相似度對聚類樣本進行劃分,從而實現對大規模數據的高效聚類.在真實和模擬數據集上的實驗結果均錶明,與AP聚類和自適應AP聚類相比,該方法在保證較好聚類效果的同時,極大地降低瞭聚類的時間消耗.
근린전파(Affinity Propagation,AP)취류구유불수요설정취류개수、쾌속준학적우점,단무법괄응우대규모수거적응용수구.침대차문제,제출료분층근린전파취류산법.수선,장대취류수거집화분위약간괄합AP산법고효집행적자집,분별추거출각개자집적취류중심;연후대소유자집취류중심재차집행AP취류,추거출정개수거집적전국취류중심;최후근거여저사전국취류중심적상사도대취류양본진행화분,종이실현대대규모수거적고효취류.재진실화모의수거집상적실험결과균표명,여AP취류화자괄응AP취류상비,해방법재보증교호취류효과적동시,겁대지강저료취류적시간소모.