计算机科学与探索
計算機科學與探索
계산궤과학여탐색
JOURNAL OF FRONTIERS OF COMPUTER SCIENCE & TECHNOLOGY
2011年
10期
166-168,176
,共4页
赵卫中%马慧芳%傅燕翔%史忠植
趙衛中%馬慧芳%傅燕翔%史忠植
조위중%마혜방%부연상%사충식
云计算%Hadoop平台%并行k-means%MapReduce
雲計算%Hadoop平檯%併行k-means%MapReduce
운계산%Hadoop평태%병행k-means%MapReduce
随着数据库技术的发展和Internet的迅速普及,实际应用中需要处理的数据量急剧地增长,致聚类研究面临许多新的问题和挑战,如海量数据和新的计算环境等.深入研究了基于云计算平台Hadoop的并行k-means聚类算法,给出了算法设计的方法和策略.在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘.
隨著數據庫技術的髮展和Internet的迅速普及,實際應用中需要處理的數據量急劇地增長,緻聚類研究麵臨許多新的問題和挑戰,如海量數據和新的計算環境等.深入研究瞭基于雲計算平檯Hadoop的併行k-means聚類算法,給齣瞭算法設計的方法和策略.在多箇不同大小數據集上的實驗錶明,設計的併行聚類算法具有優良的加速比、擴展率和數據伸縮率等性能,適閤用于海量數據的分析和挖掘.
수착수거고기술적발전화Internet적신속보급,실제응용중수요처리적수거량급극지증장,치취류연구면림허다신적문제화도전,여해량수거화신적계산배경등.심입연구료기우운계산평태Hadoop적병행k-means취류산법,급출료산법설계적방법화책략.재다개불동대소수거집상적실험표명,설계적병행취류산법구유우량적가속비、확전솔화수거신축솔등성능,괄합용우해량수거적분석화알굴.