科技资讯
科技資訊
과기자신
SCIENCE & TECHNOLOGY INFORMATION
2009年
1期
13-15
,共3页
王咏梅%嵇晓%汪恒杰%冯安平
王詠梅%嵇曉%汪恆傑%馮安平
왕영매%혜효%왕항걸%풍안평
数据质量%数据清洗%面向多数据源的数据清洗框架
數據質量%數據清洗%麵嚮多數據源的數據清洗框架
수거질량%수거청세%면향다수거원적수거청세광가
对于各个领域的信息资源管理而言,数据质量一直是一个非常关键的问题.现实世界中的数据往往存在着各种各样的问题,从简单的拼写错误到复杂的语义不一致错误.数据清洗的目标就是检测并去除数据中存在的各种错误和不一致,提高数据的质量.该文归纳.总结了数据清洗相关研究的现状,提出一个面向多数据源的数据清洗框架的定义.框架实现了术语模型、处理描述文件和共事库等概念和技术.
對于各箇領域的信息資源管理而言,數據質量一直是一箇非常關鍵的問題.現實世界中的數據往往存在著各種各樣的問題,從簡單的拼寫錯誤到複雜的語義不一緻錯誤.數據清洗的目標就是檢測併去除數據中存在的各種錯誤和不一緻,提高數據的質量.該文歸納.總結瞭數據清洗相關研究的現狀,提齣一箇麵嚮多數據源的數據清洗框架的定義.框架實現瞭術語模型、處理描述文件和共事庫等概唸和技術.
대우각개영역적신식자원관리이언,수거질량일직시일개비상관건적문제.현실세계중적수거왕왕존재착각충각양적문제,종간단적병사착오도복잡적어의불일치착오.수거청세적목표취시검측병거제수거중존재적각충착오화불일치,제고수거적질량.해문귀납.총결료수거청세상관연구적현상,제출일개면향다수거원적수거청세광가적정의.광가실현료술어모형、처리묘술문건화공사고등개념화기술.