中国科技论文在线
中國科技論文在線
중국과기논문재선
SCIENCEPAPER ONLINE
2011年
7期
469-475,481
,共8页
冷芳玲%鲍玉斌%高伟%于戈
冷芳玲%鮑玉斌%高偉%于戈
랭방령%포옥빈%고위%우과
数据仓库%聚集运算%MapReduce%联机分析处理
數據倉庫%聚集運算%MapReduce%聯機分析處理
수거창고%취집운산%MapReduce%련궤분석처리
为解决数据仓库中海量数据的处理效率问题,可以采用数据聚集预计算的方法,但是针对海量级别数据的聚集运算非常耗费计算资源,需要巨大的计算能力和存储能力,因此提出了一组基于MapReduce的面向海量数据的数据聚集运算算法,主要包括数据的选择、投影以及等值连接等,并在此基础上,实现了计数、求和和均值等聚集运算,形成了比较完整的面向海量数据的聚集运算算法。实验结果表明,该算法充分利用了集群系统的计算能力和存储能力,极大地提高了海量数据的聚集运算效率和基于聚集运算结果上的数据查询效率。
為解決數據倉庫中海量數據的處理效率問題,可以採用數據聚集預計算的方法,但是針對海量級彆數據的聚集運算非常耗費計算資源,需要巨大的計算能力和存儲能力,因此提齣瞭一組基于MapReduce的麵嚮海量數據的數據聚集運算算法,主要包括數據的選擇、投影以及等值連接等,併在此基礎上,實現瞭計數、求和和均值等聚集運算,形成瞭比較完整的麵嚮海量數據的聚集運算算法。實驗結果錶明,該算法充分利用瞭集群繫統的計算能力和存儲能力,極大地提高瞭海量數據的聚集運算效率和基于聚集運算結果上的數據查詢效率。
위해결수거창고중해량수거적처리효솔문제,가이채용수거취집예계산적방법,단시침대해량급별수거적취집운산비상모비계산자원,수요거대적계산능력화존저능력,인차제출료일조기우MapReduce적면향해량수거적수거취집운산산법,주요포괄수거적선택、투영이급등치련접등,병재차기출상,실현료계수、구화화균치등취집운산,형성료비교완정적면향해량수거적취집운산산법。실험결과표명,해산법충분이용료집군계통적계산능력화존저능력,겁대지제고료해량수거적취집운산효솔화기우취집운산결과상적수거사순효솔。