计算机光盘软件与应用
計算機光盤軟件與應用
계산궤광반연건여응용
COMPUTER CD SOFTWARE ADN APPLICATIONS
2013年
24期
69-73
,共5页
Hadoop%XML%索引%查询%海量数据
Hadoop%XML%索引%查詢%海量數據
Hadoop%XML%색인%사순%해량수거
XML(Extensible Markup Language,可扩展标记语言)凭借其简单、跨平台、方便阅读等优点,在当今各个领域得到了广泛的应用。然而,作为数据交换标准的XML面对当今海量数据,由于结构不易拆分等问题,其存储和查询性能并不理想。Hadoop的出现,提供了一种新的解决办法。由于Hadoop本身并不适合类似XML格式的半结构化文件处理,因此本文提出来一种基于Hadoop的海量XML查询的解决方案,充分利用Hadoop的并行性能,同时还引入了高效的索引机制,很好的解决了海量XML存储于查询性能问题,实验证明,该方案能达到良好的效果。
XML(Extensible Markup Language,可擴展標記語言)憑藉其簡單、跨平檯、方便閱讀等優點,在噹今各箇領域得到瞭廣汎的應用。然而,作為數據交換標準的XML麵對噹今海量數據,由于結構不易拆分等問題,其存儲和查詢性能併不理想。Hadoop的齣現,提供瞭一種新的解決辦法。由于Hadoop本身併不適閤類似XML格式的半結構化文件處理,因此本文提齣來一種基于Hadoop的海量XML查詢的解決方案,充分利用Hadoop的併行性能,同時還引入瞭高效的索引機製,很好的解決瞭海量XML存儲于查詢性能問題,實驗證明,該方案能達到良好的效果。
XML(Extensible Markup Language,가확전표기어언)빙차기간단、과평태、방편열독등우점,재당금각개영역득도료엄범적응용。연이,작위수거교환표준적XML면대당금해량수거,유우결구불역탁분등문제,기존저화사순성능병불이상。Hadoop적출현,제공료일충신적해결판법。유우Hadoop본신병불괄합유사XML격식적반결구화문건처리,인차본문제출래일충기우Hadoop적해량XML사순적해결방안,충분이용Hadoop적병행성능,동시환인입료고효적색인궤제,흔호적해결료해량XML존저우사순성능문제,실험증명,해방안능체도량호적효과。