计算机系统应用
計算機繫統應用
계산궤계통응용
APPLICATIONS OF THE COMPUTER SYSTEMS
2013年
10期
175-180
,共6页
唐长城%杨峰%代栋%孙明明%周学海
唐長城%楊峰%代棟%孫明明%週學海
당장성%양봉%대동%손명명%주학해
HBase%持久性%可用性%预写日志%写操作效率
HBase%持久性%可用性%預寫日誌%寫操作效率
HBase%지구성%가용성%예사일지%사조작효솔
HBase%durable%available%write ahead log%write performance
HBase(Hadoop DataBase)是Apache Hadoop项目下的一款非关系型数据库,它是一个基于列簇的开源数据存储系统,关于HBase的研究和应用越来越受到关注。由于HBase会在内存缓存数据后写文件系统,所以缓存的大小成为影响系统性能的一个重要因素。本文提出一种基于备份日志的持久性、可用性方案 Remote Log Process,使得HBase能够在不同的缓存规模获得更好的写性能。实验证明,在保证数据的持久性和可用性前提下, RLP能够在不同的缓存大小下获得稳定的性能,并且在缓存不超过默认设置时明显提高写操作时间性能。
HBase(Hadoop DataBase)是Apache Hadoop項目下的一款非關繫型數據庫,它是一箇基于列簇的開源數據存儲繫統,關于HBase的研究和應用越來越受到關註。由于HBase會在內存緩存數據後寫文件繫統,所以緩存的大小成為影響繫統性能的一箇重要因素。本文提齣一種基于備份日誌的持久性、可用性方案 Remote Log Process,使得HBase能夠在不同的緩存規模穫得更好的寫性能。實驗證明,在保證數據的持久性和可用性前提下, RLP能夠在不同的緩存大小下穫得穩定的性能,併且在緩存不超過默認設置時明顯提高寫操作時間性能。
HBase(Hadoop DataBase)시Apache Hadoop항목하적일관비관계형수거고,타시일개기우렬족적개원수거존저계통,관우HBase적연구화응용월래월수도관주。유우HBase회재내존완존수거후사문건계통,소이완존적대소성위영향계통성능적일개중요인소。본문제출일충기우비빈일지적지구성、가용성방안 Remote Log Process,사득HBase능구재불동적완존규모획득경호적사성능。실험증명,재보증수거적지구성화가용성전제하, RLP능구재불동적완존대소하획득은정적성능,병차재완존불초과묵인설치시명현제고사조작시간성능。
HBase, a NoSql database under Apache Hadoop, is an open source data storage system based on column family. Researches and applications based on HBase is more and more popular. But the size of memory buffer become a key factor to influence system performance as HBase will buffer data in memory before store them on file system. In this paper, we provide a new method based on copied log named Remote Log Process to make HBase perform better on write operation with different buffer size while keeping data durable and available. Experiments result indicates RLP can get a steady performance with different buffer size under the condition to guarantee durable and available of input data, while perform much better than pristine systems if the buffer isn't larger then default value.