广东工业大学学报
廣東工業大學學報
엄동공업대학학보
JOURNAL OF GUANGDONG UNIVERSITY OF TECHNOLOGY
2014年
3期
8-13
,共6页
大数据%基元%数据模型%分布式文件%可拓学
大數據%基元%數據模型%分佈式文件%可拓學
대수거%기원%수거모형%분포식문건%가탁학
big data%basic-element%data model%distributed file%Extenics
大数据将在未来经济、社会和生活等领域产生深远影响,而大数据的整合存储研究为促进和深化其应用范围有重要的理论和实践意义。本文利用分布式文件系统HBase的数据存储结构特征,采用可拓学基元对异构数据集进行整合处理并存储在HBase数据库。通过提取数据特别是半结构化和非结构化数据的典型特征和属性取值并转换为基元后生成一个新的数据集,不但为数据分析和数据解释提供一种新的实现方式,而且为领域问题的策略生成提供大数据的研究思路和解决方案。
大數據將在未來經濟、社會和生活等領域產生深遠影響,而大數據的整閤存儲研究為促進和深化其應用範圍有重要的理論和實踐意義。本文利用分佈式文件繫統HBase的數據存儲結構特徵,採用可拓學基元對異構數據集進行整閤處理併存儲在HBase數據庫。通過提取數據特彆是半結構化和非結構化數據的典型特徵和屬性取值併轉換為基元後生成一箇新的數據集,不但為數據分析和數據解釋提供一種新的實現方式,而且為領域問題的策略生成提供大數據的研究思路和解決方案。
대수거장재미래경제、사회화생활등영역산생심원영향,이대수거적정합존저연구위촉진화심화기응용범위유중요적이론화실천의의。본문이용분포식문건계통HBase적수거존저결구특정,채용가탁학기원대이구수거집진행정합처리병존저재HBase수거고。통과제취수거특별시반결구화화비결구화수거적전형특정화속성취치병전환위기원후생성일개신적수거집,불단위수거분석화수거해석제공일충신적실현방식,이차위영역문제적책략생성제공대수거적연구사로화해결방안。
Big data will have a profound impact on economics , society and life in the near future , and the research on integration and storage of big data may play an important theoretical and practical role in pro-moting and deepening the application scope of big data .It utilized the data storage structure of the dis-tributed file system named as HBase and the basic-element of Extenics to integrate the heterogeneous data sets , and then stored the processed data set in HBase database .The new data set , which was obtained by extracting the typical characteristics as well as their value of data , especially the semi-structured and un-structured data , provides not only a new way for the analysis and interpretation of data but also the re-search ideas and strategy generation for the professional issues from the perspective of big data .