计算机与数字工程
計算機與數字工程
계산궤여수자공정
COMPUTER & DIGITAL ENGINEERING
2014年
11期
2198-2201
,共4页
王静婷%王艳丽%王振辉
王靜婷%王豔麗%王振輝
왕정정%왕염려%왕진휘
XML数据%DOM对象%半结构化数据%抽取%装载%ETL工具%数据仓库
XML數據%DOM對象%半結構化數據%抽取%裝載%ETL工具%數據倉庫
XML수거%DOM대상%반결구화수거%추취%장재%ETL공구%수거창고
XML(eXtensible Markup Language) data%DOM(Document Object Model) object%semi-structured data%extraction%loading%ETL(Extract-Transform-Load) tool%data warehouse
通过分析半结构化数据的特点,以实际的采购退货数据(BokeDataInfo .xml)为例,利用DOM 对象对基于XML的半结构化的数据进行抽取,设计并实现了一个基于半结构数据的数据仓库ETL工具,解决了商用ETL工具不能直接加载抽取XM L文件进行数据仓库数据加载的弊端,为XM L半结构化数据的抽取并装载到数据仓库当前细节级中的这一问题的解决进行了有益的探索。
通過分析半結構化數據的特點,以實際的採購退貨數據(BokeDataInfo .xml)為例,利用DOM 對象對基于XML的半結構化的數據進行抽取,設計併實現瞭一箇基于半結構數據的數據倉庫ETL工具,解決瞭商用ETL工具不能直接加載抽取XM L文件進行數據倉庫數據加載的弊耑,為XM L半結構化數據的抽取併裝載到數據倉庫噹前細節級中的這一問題的解決進行瞭有益的探索。
통과분석반결구화수거적특점,이실제적채구퇴화수거(BokeDataInfo .xml)위례,이용DOM 대상대기우XML적반결구화적수거진행추취,설계병실현료일개기우반결구수거적수거창고ETL공구,해결료상용ETL공구불능직접가재추취XM L문건진행수거창고수거가재적폐단,위XM L반결구화수거적추취병장재도수거창고당전세절급중적저일문제적해결진행료유익적탐색。
By analyzing the characteristics of Semi‐structured data and using the actual Book Return Data(BokeDataIn‐fo .xml) as an example ,this paper uses DOM objects to extract XML‐based Semi‐structured data and designs and implements a Data Warehouse ETL tool based on the Semi‐structured data .At the same time ,it also solves the commercial ETL tool can not directly load and extract the XML documents for the disadvantages of the loading of Data Warehouse data .To solve the problem of extracting and loading the semi‐structured XML data into the current level of detail of the Data Warehouse is use‐ful exploration .