北华航天工业学院学报
北華航天工業學院學報
북화항천공업학원학보
JOURNAL OF NORTH CHINA INSTITUTE OF AEROSPACE ENGINEERING
2015年
1期
24-26
,共3页
何志学%庄连英%斯庆巴拉
何誌學%莊連英%斯慶巴拉
하지학%장련영%사경파랍
分布式计算%MapReduce模型%XML数据%Hadoop平台
分佈式計算%MapReduce模型%XML數據%Hadoop平檯
분포식계산%MapReduce모형%XML수거%Hadoop평태
为解决半结构化XML大数据的处理分析问题,分析了Twig查询结构特点和Hadoop平台架构特征.基于Hadoop平台,通过对XML数据的水平切分,设计了XML数据在HDFS上的分布式存储策略;将Twig查询分解为线性路径,实现了基于MapReduce编程模型的并行查询方法.最后通过实验验证了该方法的有效性.
為解決半結構化XML大數據的處理分析問題,分析瞭Twig查詢結構特點和Hadoop平檯架構特徵.基于Hadoop平檯,通過對XML數據的水平切分,設計瞭XML數據在HDFS上的分佈式存儲策略;將Twig查詢分解為線性路徑,實現瞭基于MapReduce編程模型的併行查詢方法.最後通過實驗驗證瞭該方法的有效性.
위해결반결구화XML대수거적처리분석문제,분석료Twig사순결구특점화Hadoop평태가구특정.기우Hadoop평태,통과대XML수거적수평절분,설계료XML수거재HDFS상적분포식존저책략;장Twig사순분해위선성로경,실현료기우MapReduce편정모형적병행사순방법.최후통과실험험증료해방법적유효성.