电子设计工程
電子設計工程
전자설계공정
ELECTRONIC DESIGN ENGINEERING
2015年
2期
48-50,53
,共4页
数据挖掘%聚类%MapReduce%并行化计算
數據挖掘%聚類%MapReduce%併行化計算
수거알굴%취류%MapReduce%병행화계산
data mining%clustering%MapReduce%parallel computing
文中基于使传统聚类算法能够满足当前大数据分析的对计算效率的需求,采用将传统聚类算法分布式化的方法提高传统聚类算法效率。结合近年来广泛使用的MapReduce分布式处理模型,对K-means、PAM、CLARA 3种算法进行了分布式化实验,并从数据规模和节点数量两个方面考察、讨论了一些影响并行算法性能的因素。实验分析表明,该方法能够有效地将聚类方法并行化,并可以应用在分布式系统当中。
文中基于使傳統聚類算法能夠滿足噹前大數據分析的對計算效率的需求,採用將傳統聚類算法分佈式化的方法提高傳統聚類算法效率。結閤近年來廣汎使用的MapReduce分佈式處理模型,對K-means、PAM、CLARA 3種算法進行瞭分佈式化實驗,併從數據規模和節點數量兩箇方麵攷察、討論瞭一些影響併行算法性能的因素。實驗分析錶明,該方法能夠有效地將聚類方法併行化,併可以應用在分佈式繫統噹中。
문중기우사전통취류산법능구만족당전대수거분석적대계산효솔적수구,채용장전통취류산법분포식화적방법제고전통취류산법효솔。결합근년래엄범사용적MapReduce분포식처리모형,대K-means、PAM、CLARA 3충산법진행료분포식화실험,병종수거규모화절점수량량개방면고찰、토론료일사영향병행산법성능적인소。실험분석표명,해방법능구유효지장취류방법병행화,병가이응용재분포식계통당중。
Based on the traditional clustering algorithms to meet the needs of today's big data analysis of computational efficiency, distributed clustering algorithm of the traditional to improve the efficiency of traditional clustering algorithm. Binding the widely used in recent years distributed model MapReduce ,made three experiments using K-means, PAM and CLARA to realize the parallel clustering.Through changing the size of data and the number of nodes to discuss the factor effected the parallel performance of the algorithm. The experiments show that this method can effectively parallelize the clustering method, and can be used in which distributed systems.