福建电脑
福建電腦
복건전뇌
FUJIAN COMPUTER
2014年
11期
107-110,160
,共5页
仇伟涛%范家铭%李丹
仇偉濤%範傢銘%李丹
구위도%범가명%리단
大数据%Dremel%列存储数据库%Hbase%半结构化数据
大數據%Dremel%列存儲數據庫%Hbase%半結構化數據
대수거%Dremel%렬존저수거고%Hbase%반결구화수거
本文用以Dremel系统为基础解决在HBase系统下如何查询大量的半结构化数据。基本原理是进行先进行数据预处理将半结构化数据进行拆分,将记录拆分成列使用表存储,拆分之后保持原有之间的半结构化数据的树之间的上下层关系,然后再查询的时候只查询条件相关的列,然后做集合计算,即可得到数据需要查询的结果,从而节省了很多时间。
本文用以Dremel繫統為基礎解決在HBase繫統下如何查詢大量的半結構化數據。基本原理是進行先進行數據預處理將半結構化數據進行拆分,將記錄拆分成列使用錶存儲,拆分之後保持原有之間的半結構化數據的樹之間的上下層關繫,然後再查詢的時候隻查詢條件相關的列,然後做集閤計算,即可得到數據需要查詢的結果,從而節省瞭很多時間。
본문용이Dremel계통위기출해결재HBase계통하여하사순대량적반결구화수거。기본원리시진행선진행수거예처리장반결구화수거진행탁분,장기록탁분성렬사용표존저,탁분지후보지원유지간적반결구화수거적수지간적상하층관계,연후재사순적시후지사순조건상관적렬,연후주집합계산,즉가득도수거수요사순적결과,종이절성료흔다시간。