计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2014年
4期
56-58
,共3页
图片文件%去重%分布式%MD5
圖片文件%去重%分佈式%MD5
도편문건%거중%분포식%MD5
Image file%Deduplication%Distributed%MD5
提出一种基于分布式数据库与分布式文件系统相结合的海量图片文件存储去重技术。该技术通过提取图片文件二进制流的特征段计算文件 MD5码签名,依据签名对图片文件进行存储去重。结合实验数据分析验证该技术不仅能够准确地去重图片,有较高的删除率,且经对比得到该技术在计算签名时间、上传速度等方面均优于文件级去重和块级去重技术,是对海量图片数据存储的一种优化。同时针对该技术的不足提出了改进方案。
提齣一種基于分佈式數據庫與分佈式文件繫統相結閤的海量圖片文件存儲去重技術。該技術通過提取圖片文件二進製流的特徵段計算文件 MD5碼籤名,依據籤名對圖片文件進行存儲去重。結閤實驗數據分析驗證該技術不僅能夠準確地去重圖片,有較高的刪除率,且經對比得到該技術在計算籤名時間、上傳速度等方麵均優于文件級去重和塊級去重技術,是對海量圖片數據存儲的一種優化。同時針對該技術的不足提齣瞭改進方案。
제출일충기우분포식수거고여분포식문건계통상결합적해량도편문건존저거중기술。해기술통과제취도편문건이진제류적특정단계산문건 MD5마첨명,의거첨명대도편문건진행존저거중。결합실험수거분석험증해기술불부능구준학지거중도편,유교고적산제솔,차경대비득도해기술재계산첨명시간、상전속도등방면균우우문건급거중화괴급거중기술,시대해량도편수거존저적일충우화。동시침대해기술적불족제출료개진방안。
In this paper we present a deduplication technology for massive image files storage.This technology,which is based on the combination of distributed database and distributed file system,calculates file’s of MD5 signature by extracting the feature segment of binary stream of image files,and deduplicates the storage in regard to image files according to the signature.It has been analysed and verified in combination with the experimental data that this technology is accurate in deduplicating images,besides,it has a high deletion rate.What’s more,compared with file-level deduplication and block-level deduplication technology,this technology is superior in calculating the time of signature and uploading speed,and offers an optimisation to massive image files storage.Meanwhile,we also put forward in this paper an improved scheme aiming at the deficiency of this technology.