计算机研究与发展
計算機研究與髮展
계산궤연구여발전
JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT
2012年
z1期
1-5
,共5页
吴广君%王树鹏%陈明%李超
吳廣君%王樹鵬%陳明%李超
오엄군%왕수붕%진명%리초
大数据%Hadoop%数据检索%No-SQL数据库%海量数据存储
大數據%Hadoop%數據檢索%No-SQL數據庫%海量數據存儲
대수거%Hadoop%수거검색%No-SQL수거고%해량수거존저
Big Data是近年在云计算领域中出现的一种新型数据,传统关系型数据库系统在数据存储规模、检索效率等方面不再适用.目前的分布式No-SQL数据库可以提供分布式数据存储环境,但是无法支持多列查询.设计并实现分布式海量结构化数据存储检索系统(MDSS).系统采用列存储结构,采用集中分布式B+ Tree索引和局部索引相结合的方法提高检索效率.在此基础上讨论复杂查询条件的任务分解机制,支持大数据的多属性检索、模糊检索以及统计分析等查询功能.实验结果表明,提出的分布式结构化数据管理技术和查询任务分解机制可以显著提高分布式条件下大数据集的查询效率,适合应用在日志类数据、流记录数据等海量结构化数据的存储应用场合.
Big Data是近年在雲計算領域中齣現的一種新型數據,傳統關繫型數據庫繫統在數據存儲規模、檢索效率等方麵不再適用.目前的分佈式No-SQL數據庫可以提供分佈式數據存儲環境,但是無法支持多列查詢.設計併實現分佈式海量結構化數據存儲檢索繫統(MDSS).繫統採用列存儲結構,採用集中分佈式B+ Tree索引和跼部索引相結閤的方法提高檢索效率.在此基礎上討論複雜查詢條件的任務分解機製,支持大數據的多屬性檢索、模糊檢索以及統計分析等查詢功能.實驗結果錶明,提齣的分佈式結構化數據管理技術和查詢任務分解機製可以顯著提高分佈式條件下大數據集的查詢效率,適閤應用在日誌類數據、流記錄數據等海量結構化數據的存儲應用場閤.
Big Data시근년재운계산영역중출현적일충신형수거,전통관계형수거고계통재수거존저규모、검색효솔등방면불재괄용.목전적분포식No-SQL수거고가이제공분포식수거존저배경,단시무법지지다렬사순.설계병실현분포식해량결구화수거존저검색계통(MDSS).계통채용렬존저결구,채용집중분포식B+ Tree색인화국부색인상결합적방법제고검색효솔.재차기출상토론복잡사순조건적임무분해궤제,지지대수거적다속성검색、모호검색이급통계분석등사순공능.실험결과표명,제출적분포식결구화수거관리기술화사순임무분해궤제가이현저제고분포식조건하대수거집적사순효솔,괄합응용재일지류수거、류기록수거등해량결구화수거적존저응용장합.