华东师范大学学报(自然科学版)
華東師範大學學報(自然科學版)
화동사범대학학보(자연과학판)
JOURNAL OF EAST CHINA NORMAL UNIVERSITY(NATURAL SCIENCE)
2014年
5期
290-300
,共11页
庞天泽%张晨东%高明%宫学庆
龐天澤%張晨東%高明%宮學慶
방천택%장신동%고명%궁학경
反范式%分布式数据库%OceanBase%TPC-H
反範式%分佈式數據庫%OceanBase%TPC-H
반범식%분포식수거고%OceanBase%TPC-H
denormalization%distributed database%OceanBase%TPC-H
近年来,数据规模呈爆炸式增长,使得传统集中式数据库难以满足业务需求.而分布式数据库可以将数据存储在多个节点上,具有更好的扩展性,从而可以支撑业务的不断增长.目前,许多企业已经开发出了成功的分布式数据库产品,例如Google Spanner、淘宝的OceanBase等.传统数据库模式设计中,三大范式(1NF、2NF和3NF)及其扩展范式能够减少数据冗余和更新异常,并保证数据的完整性.然而,在分布式架构下,严格遵循范式的模式设计可能带来查询效率较低等问题,而使用反范式模式设计方法通常可以有效提高查询效率.OceanBase是淘宝自主研发的分布式数据库,支持跨行跨表事务,并在OLTP中具有良好的性能,但是对于OLAP业务,其性能并不高.本文将以OceanBase为例,介绍如何利用反范式设计分布式数据库模式,以改善OLAP的查询性能,并通过在OceanBase上部署TPC-H基准评测验证了反范式模式设计的有效性和高效性.
近年來,數據規模呈爆炸式增長,使得傳統集中式數據庫難以滿足業務需求.而分佈式數據庫可以將數據存儲在多箇節點上,具有更好的擴展性,從而可以支撐業務的不斷增長.目前,許多企業已經開髮齣瞭成功的分佈式數據庫產品,例如Google Spanner、淘寶的OceanBase等.傳統數據庫模式設計中,三大範式(1NF、2NF和3NF)及其擴展範式能夠減少數據冗餘和更新異常,併保證數據的完整性.然而,在分佈式架構下,嚴格遵循範式的模式設計可能帶來查詢效率較低等問題,而使用反範式模式設計方法通常可以有效提高查詢效率.OceanBase是淘寶自主研髮的分佈式數據庫,支持跨行跨錶事務,併在OLTP中具有良好的性能,但是對于OLAP業務,其性能併不高.本文將以OceanBase為例,介紹如何利用反範式設計分佈式數據庫模式,以改善OLAP的查詢性能,併通過在OceanBase上部署TPC-H基準評測驗證瞭反範式模式設計的有效性和高效性.
근년래,수거규모정폭작식증장,사득전통집중식수거고난이만족업무수구.이분포식수거고가이장수거존저재다개절점상,구유경호적확전성,종이가이지탱업무적불단증장.목전,허다기업이경개발출료성공적분포식수거고산품,례여Google Spanner、도보적OceanBase등.전통수거고모식설계중,삼대범식(1NF、2NF화3NF)급기확전범식능구감소수거용여화경신이상,병보증수거적완정성.연이,재분포식가구하,엄격준순범식적모식설계가능대래사순효솔교저등문제,이사용반범식모식설계방법통상가이유효제고사순효솔.OceanBase시도보자주연발적분포식수거고,지지과행과표사무,병재OLTP중구유량호적성능,단시대우OLAP업무,기성능병불고.본문장이OceanBase위례,개소여하이용반범식설계분포식수거고모식,이개선OLAP적사순성능,병통과재OceanBase상부서TPC-H기준평측험증료반범식모식설계적유효성화고효성.