计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2003年
3期
95-96,183
,共3页
郭志懋%俞荣华%田增平%周傲英
郭誌懋%俞榮華%田增平%週傲英
곽지무%유영화%전증평%주오영
数据准备%数据清洗%术语模型
數據準備%數據清洗%術語模型
수거준비%수거청세%술어모형
在给数据挖掘这类应用准备数据的过程中,面临着一系列数据清洗问题.要把数据清洗过程做得很灵活并不容易,已有的工具往往过于依赖特定的应用.该文提出并实现了一个可扩展的数据清洗框架.它以术语模型、过程描述文件、共享库等概念和技术实现了模块的高度独立性和系统的可扩展性,并提供了一个可视化的流程定义环境.
在給數據挖掘這類應用準備數據的過程中,麵臨著一繫列數據清洗問題.要把數據清洗過程做得很靈活併不容易,已有的工具往往過于依賴特定的應用.該文提齣併實現瞭一箇可擴展的數據清洗框架.它以術語模型、過程描述文件、共享庫等概唸和技術實現瞭模塊的高度獨立性和繫統的可擴展性,併提供瞭一箇可視化的流程定義環境.
재급수거알굴저류응용준비수거적과정중,면림착일계렬수거청세문제.요파수거청세과정주득흔령활병불용역,이유적공구왕왕과우의뢰특정적응용.해문제출병실현료일개가확전적수거청세광가.타이술어모형、과정묘술문건、공향고등개념화기술실현료모괴적고도독립성화계통적가확전성,병제공료일개가시화적류정정의배경.