智能计算机与应用
智能計算機與應用
지능계산궤여응용
Computer Study
2015年
3期
88-90
,共3页
大数据%数据质量%云清洗%Map-Reduce
大數據%數據質量%雲清洗%Map-Reduce
대수거%수거질량%운청세%Map-Reduce
数据清洗是大数据中一个重要的主题.本文基于Hadoop设计并实现了一个大数据的云清洗系统.通过Map-Reduce计算模型,该系统能够检测并修复数据质量方面的各类问题.该系统包含以下特征:(1)支持数据质量方面各类问题的清洗工作;(2)数据云清洗进度可视化以及参数设置;(3)友好的数据集输入接口以及清洗后的数据集输出接口.该大数据云清洗系统对文本数据和数据库数据均是一个有效且高效的数据清洗系统.
數據清洗是大數據中一箇重要的主題.本文基于Hadoop設計併實現瞭一箇大數據的雲清洗繫統.通過Map-Reduce計算模型,該繫統能夠檢測併脩複數據質量方麵的各類問題.該繫統包含以下特徵:(1)支持數據質量方麵各類問題的清洗工作;(2)數據雲清洗進度可視化以及參數設置;(3)友好的數據集輸入接口以及清洗後的數據集輸齣接口.該大數據雲清洗繫統對文本數據和數據庫數據均是一箇有效且高效的數據清洗繫統.
수거청세시대수거중일개중요적주제.본문기우Hadoop설계병실현료일개대수거적운청세계통.통과Map-Reduce계산모형,해계통능구검측병수복수거질량방면적각류문제.해계통포함이하특정:(1)지지수거질량방면각류문제적청세공작;(2)수거운청세진도가시화이급삼수설치;(3)우호적수거집수입접구이급청세후적수거집수출접구.해대수거운청세계통대문본수거화수거고수거균시일개유효차고효적수거청세계통.