青年时代
青年時代
청년시대
Youth Times
2015年
18期
159-160
,共2页
王文青%柴旭超%王丹宁
王文青%柴旭超%王丹寧
왕문청%시욱초%왕단저
地震数据%大数据%Hadoop%HDFS%磁盘阵列%MapReduce
地震數據%大數據%Hadoop%HDFS%磁盤陣列%MapReduce
지진수거%대수거%Hadoop%HDFS%자반진렬%MapReduce
随着信息技术发展的日新月异,大数据已逐步应用于各行各业。其中在地震预测和分析方面,由于所产生的数据量也在大幅增长,大规模数据的处理问题给地震预测和分析行业带来严峻的挑战。Hadoop开源项目的日益成熟,给地震预测和分析行业带来了可行的解决方案,多家研究机构均已基于Hadoop进行各种尝试。本文重点针对数据的存储与分析两个方面,结合设备合理有效利用的需求,对Hadoop的存储和分析模型进行针对性优化,以达到成本的优化和性能的提升。通过采用磁盘阵列RAID技术,结合NFS文件共享技术,成功替代Hadoop的HDFS的三副本技术,使得数据存储的成本大幅度降低,数据可靠性得以提升;同时,通过对于Hadoop的数据布局的均衡处理和Map-Reduce流程中shuffle阶段的改进,使数据分析处理的性能得以提升。
隨著信息技術髮展的日新月異,大數據已逐步應用于各行各業。其中在地震預測和分析方麵,由于所產生的數據量也在大幅增長,大規模數據的處理問題給地震預測和分析行業帶來嚴峻的挑戰。Hadoop開源項目的日益成熟,給地震預測和分析行業帶來瞭可行的解決方案,多傢研究機構均已基于Hadoop進行各種嘗試。本文重點針對數據的存儲與分析兩箇方麵,結閤設備閤理有效利用的需求,對Hadoop的存儲和分析模型進行針對性優化,以達到成本的優化和性能的提升。通過採用磁盤陣列RAID技術,結閤NFS文件共享技術,成功替代Hadoop的HDFS的三副本技術,使得數據存儲的成本大幅度降低,數據可靠性得以提升;同時,通過對于Hadoop的數據佈跼的均衡處理和Map-Reduce流程中shuffle階段的改進,使數據分析處理的性能得以提升。
수착신식기술발전적일신월이,대수거이축보응용우각행각업。기중재지진예측화분석방면,유우소산생적수거량야재대폭증장,대규모수거적처리문제급지진예측화분석행업대래엄준적도전。Hadoop개원항목적일익성숙,급지진예측화분석행업대래료가행적해결방안,다가연구궤구균이기우Hadoop진행각충상시。본문중점침대수거적존저여분석량개방면,결합설비합리유효이용적수구,대Hadoop적존저화분석모형진행침대성우화,이체도성본적우화화성능적제승。통과채용자반진렬RAID기술,결합NFS문건공향기술,성공체대Hadoop적HDFS적삼부본기술,사득수거존저적성본대폭도강저,수거가고성득이제승;동시,통과대우Hadoop적수거포국적균형처리화Map-Reduce류정중shuffle계단적개진,사수거분석처리적성능득이제승。