西安交通大学学报
西安交通大學學報
서안교통대학학보
JOURNAL OF XI'AN JIAOTONG UNIVERSITY
2013年
10期
51-56
,共6页
王龙翔%张兴军%朱国峰%朱跃光%董小社
王龍翔%張興軍%硃國峰%硃躍光%董小社
왕룡상%장흥군%주국봉%주약광%동소사
重复数据删除%分组预测%大规模存储系统
重複數據刪除%分組預測%大規模存儲繫統
중복수거산제%분조예측%대규모존저계통
data de-duplication%grouping predict%large-scale storage system
针对重复数据删除系统中存储容量受内存限制难以进行扩展的问题,提出了一种基于无向图遍历的重复数据删除分组预测方法.该方法将索引表保存在磁盘中,并在内存中维护索引表缓存,以此提高系统最大可支持的存储容量.对于索引表缓存命中率低、系统性能差的问题,采用了图遍历分组方法予以解决,根据数据块访问序列特征信息建立无向图并进行分析,基于分析结果对索引项进行分组,并以组进行缓存替换,从而提高缓存命中率和系统性能.实验结果表明,基于缓存预取原理和无向图遍历分组,在将缓存设置为索引表大小的10%时,重复数据删除存储系统最大存储容量比原有方法提高了7.5倍,缓存命中率由不进行索引项分组时的47%提高到87.6%.
針對重複數據刪除繫統中存儲容量受內存限製難以進行擴展的問題,提齣瞭一種基于無嚮圖遍歷的重複數據刪除分組預測方法.該方法將索引錶保存在磁盤中,併在內存中維護索引錶緩存,以此提高繫統最大可支持的存儲容量.對于索引錶緩存命中率低、繫統性能差的問題,採用瞭圖遍歷分組方法予以解決,根據數據塊訪問序列特徵信息建立無嚮圖併進行分析,基于分析結果對索引項進行分組,併以組進行緩存替換,從而提高緩存命中率和繫統性能.實驗結果錶明,基于緩存預取原理和無嚮圖遍歷分組,在將緩存設置為索引錶大小的10%時,重複數據刪除存儲繫統最大存儲容量比原有方法提高瞭7.5倍,緩存命中率由不進行索引項分組時的47%提高到87.6%.
침대중복수거산제계통중존저용량수내존한제난이진행확전적문제,제출료일충기우무향도편력적중복수거산제분조예측방법.해방법장색인표보존재자반중,병재내존중유호색인표완존,이차제고계통최대가지지적존저용량.대우색인표완존명중솔저、계통성능차적문제,채용료도편력분조방법여이해결,근거수거괴방문서렬특정신식건립무향도병진행분석,기우분석결과대색인항진행분조,병이조진행완존체환,종이제고완존명중솔화계통성능.실험결과표명,기우완존예취원리화무향도편력분조,재장완존설치위색인표대소적10%시,중복수거산제존저계통최대존저용량비원유방법제고료7.5배,완존명중솔유불진행색인항분조시적47%제고도87.6%.