计算机工程与设计
計算機工程與設計
계산궤공정여설계
Computer Engineering and Design
2015年
11期
2990-2994
,共5页
云计算%Canopy-Kmeans算法%三角不等式原理%大数据%并行
雲計算%Canopy-Kmeans算法%三角不等式原理%大數據%併行
운계산%Canopy-Kmeans산법%삼각불등식원리%대수거%병행
cloud computing%Canopy-Kmeans%triangle inequality%big data%parallel
针对大数据的海量与高维特性,提出一种在云计算平台上基于MapReduce框架的距离三角不等式Canopy‐Kmeans并行聚类算法。利用三角不等式的原理减少计算冗余,提高原算法的执行速度。实验结果表明,该算法减少了I/O以及网络传输的消耗,克服了算法陷入局部最优解的缺点,使之能够充分利用集群的计算和存储能力对大数据进行聚类分析。
針對大數據的海量與高維特性,提齣一種在雲計算平檯上基于MapReduce框架的距離三角不等式Canopy‐Kmeans併行聚類算法。利用三角不等式的原理減少計算冗餘,提高原算法的執行速度。實驗結果錶明,該算法減少瞭I/O以及網絡傳輸的消耗,剋服瞭算法陷入跼部最優解的缺點,使之能夠充分利用集群的計算和存儲能力對大數據進行聚類分析。
침대대수거적해량여고유특성,제출일충재운계산평태상기우MapReduce광가적거리삼각불등식Canopy‐Kmeans병행취류산법。이용삼각불등식적원리감소계산용여,제고원산법적집행속도。실험결과표명,해산법감소료I/O이급망락전수적소모,극복료산법함입국부최우해적결점,사지능구충분이용집군적계산화존저능력대대수거진행취류분석。
For processing massive data ,a MapReduce based triangle inequality Canopy‐Kmeans algorithm was proposed .The theory of the triangle inequality was adopted ,and the computational redundancy and operation time were reduced .The experi‐mental results demonstrate that the algorithm reduces the consumption of I/O and network transmission ,and overcomes the shortage of local optimum ,so it can effectively process big data based on MapReduce framework .