计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2012年
3期
477-490
,共14页
亓开元%赵卓峰%房俊%马强
亓開元%趙卓峰%房俊%馬彊
기개원%조탁봉%방준%마강
数据流处理%大规模数据处理%MapReduce%物联网%大数据%云计算
數據流處理%大規模數據處理%MapReduce%物聯網%大數據%雲計算
수거류처리%대규모수거처리%MapReduce%물련망%대수거%운계산
以实时传感数据和历史感知数据为基础的各类计算需求逐渐成为当前物联网应用建设中的关键,如何实现基于高速数据流和大规模历史数据的实时计算成为数据处理领域的新挑战.现有批处理方式的MapReduce大规模数据处理技术难以满足此类计算的实时要求.文中结合城市车辆数据的实时采集与处理应用,在理论和实践分析的基础上,提出了一种针对高速数据流的大规模数据实时处理方法,并对方法中的本地阶段化流水线、中间结果缓存等关键技术瓶颈进行了改进.其中,根据系统参数控制阶段化流水线,使CPU得到了充分、有效利用;通过改造内外存数据结构、读写策略和替换算法,优化了本地中间结果的高并发读写性能.实验表明,上述方法可以显著提升大规模历史数据上数据流处理的实时性和可伸缩性.
以實時傳感數據和歷史感知數據為基礎的各類計算需求逐漸成為噹前物聯網應用建設中的關鍵,如何實現基于高速數據流和大規模歷史數據的實時計算成為數據處理領域的新挑戰.現有批處理方式的MapReduce大規模數據處理技術難以滿足此類計算的實時要求.文中結閤城市車輛數據的實時採集與處理應用,在理論和實踐分析的基礎上,提齣瞭一種針對高速數據流的大規模數據實時處理方法,併對方法中的本地階段化流水線、中間結果緩存等關鍵技術瓶頸進行瞭改進.其中,根據繫統參數控製階段化流水線,使CPU得到瞭充分、有效利用;通過改造內外存數據結構、讀寫策略和替換算法,優化瞭本地中間結果的高併髮讀寫性能.實驗錶明,上述方法可以顯著提升大規模歷史數據上數據流處理的實時性和可伸縮性.
이실시전감수거화역사감지수거위기출적각류계산수구축점성위당전물련망응용건설중적관건,여하실현기우고속수거류화대규모역사수거적실시계산성위수거처리영역적신도전.현유비처리방식적MapReduce대규모수거처리기술난이만족차류계산적실시요구.문중결합성시차량수거적실시채집여처리응용,재이론화실천분석적기출상,제출료일충침대고속수거류적대규모수거실시처리방법,병대방법중적본지계단화류수선、중간결과완존등관건기술병경진행료개진.기중,근거계통삼수공제계단화류수선,사CPU득도료충분、유효이용;통과개조내외존수거결구、독사책략화체환산법,우화료본지중간결과적고병발독사성능.실험표명,상술방법가이현저제승대규모역사수거상수거류처리적실시성화가신축성.