计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2013年
4期
1023-1025,1035
,共4页
K-Medoids%云计算%MapReduee%并行计算%Hadoop
K-Medoids%雲計算%MapReduee%併行計算%Hadoop
K-Medoids%운계산%MapReduee%병행계산%Hadoop
为了解决传统K-Medoids聚类算法在处理海量数据信息时所面临的内存容量和CPU处理速度的瓶颈问题,在深入研究K-Medoids算法的基础之上,提出了基于MapReduce编程模型的K-Medoids并行化算法思想.Map函数部分的主要任务是计算每个数据对象到簇类中心点的距离并(重新)分配其所属的聚类簇;Reduce函数部分的主要任务是根据Map部分得到的中间结果,计算出新簇类的中心点,然后作为中心点集给下一次MapReduce过程使用.实验结果表明:运行在Hadoop集群上的基于MapReduce的K-Medoids并行化算法具有较好的聚类结果和可扩展性,对于较大的数据集,该算法得到的加速比更接近于线性.
為瞭解決傳統K-Medoids聚類算法在處理海量數據信息時所麵臨的內存容量和CPU處理速度的瓶頸問題,在深入研究K-Medoids算法的基礎之上,提齣瞭基于MapReduce編程模型的K-Medoids併行化算法思想.Map函數部分的主要任務是計算每箇數據對象到簇類中心點的距離併(重新)分配其所屬的聚類簇;Reduce函數部分的主要任務是根據Map部分得到的中間結果,計算齣新簇類的中心點,然後作為中心點集給下一次MapReduce過程使用.實驗結果錶明:運行在Hadoop集群上的基于MapReduce的K-Medoids併行化算法具有較好的聚類結果和可擴展性,對于較大的數據集,該算法得到的加速比更接近于線性.
위료해결전통K-Medoids취류산법재처리해량수거신식시소면림적내존용량화CPU처리속도적병경문제,재심입연구K-Medoids산법적기출지상,제출료기우MapReduce편정모형적K-Medoids병행화산법사상.Map함수부분적주요임무시계산매개수거대상도족류중심점적거리병(중신)분배기소속적취류족;Reduce함수부분적주요임무시근거Map부분득도적중간결과,계산출신족류적중심점,연후작위중심점집급하일차MapReduce과정사용.실험결과표명:운행재Hadoop집군상적기우MapReduce적K-Medoids병행화산법구유교호적취류결과화가확전성,대우교대적수거집,해산법득도적가속비경접근우선성.