微型电脑应用
微型電腦應用
미형전뇌응용
Microcomputer Applications
2015年
10期
25-26,33
,共3页
档案文档%图像化%去重%MD5%分布式存储
檔案文檔%圖像化%去重%MD5%分佈式存儲
당안문당%도상화%거중%MD5%분포식존저
针对达州市档案局数以万计的档案纸质文档需要通过扫描等技术图像化存储的现有情况,提出了一种在大数据下对相同图片文档去重的策略,先把图片文档转换成二进制流并计算其MD5签名,依据签名对图片文档进行去重实现分布式存储,并通过实验对该模型进行模拟验证,得出一种有效的档案图片文档去重模型。
針對達州市檔案跼數以萬計的檔案紙質文檔需要通過掃描等技術圖像化存儲的現有情況,提齣瞭一種在大數據下對相同圖片文檔去重的策略,先把圖片文檔轉換成二進製流併計算其MD5籤名,依據籤名對圖片文檔進行去重實現分佈式存儲,併通過實驗對該模型進行模擬驗證,得齣一種有效的檔案圖片文檔去重模型。
침대체주시당안국수이만계적당안지질문당수요통과소묘등기술도상화존저적현유정황,제출료일충재대수거하대상동도편문당거중적책략,선파도편문당전환성이진제류병계산기MD5첨명,의거첨명대도편문당진행거중실현분포식존저,병통과실험대해모형진행모의험증,득출일충유효적당안도편문당거중모형。