科技经济市场
科技經濟市場
과기경제시장
KEJI JINGJI SHICHANG
2006年
9期
20-21
,共2页
AVL树%MD5%重复记录%数据清洗
AVL樹%MD5%重複記錄%數據清洗
AVL수%MD5%중복기록%수거청세
数据清洗是建立数据仓库及进行数据挖掘的一个重要步骤.在数据挖掘过程中,重复冗余的数据会造成挖掘结果的偏差.本文使用AVL树作为对象识别标志Key的记录结构,通过判断生成的MD5信息摘要的插入操作来判断该Key是否已经存在,从而实现重复数据的清除.
數據清洗是建立數據倉庫及進行數據挖掘的一箇重要步驟.在數據挖掘過程中,重複冗餘的數據會造成挖掘結果的偏差.本文使用AVL樹作為對象識彆標誌Key的記錄結構,通過判斷生成的MD5信息摘要的插入操作來判斷該Key是否已經存在,從而實現重複數據的清除.
수거청세시건립수거창고급진행수거알굴적일개중요보취.재수거알굴과정중,중복용여적수거회조성알굴결과적편차.본문사용AVL수작위대상식별표지Key적기록결구,통과판단생성적MD5신식적요적삽입조작래판단해Key시부이경존재,종이실현중복수거적청제.