计算机与网络
計算機與網絡
계산궤여망락
CHINA COMPUTER & NETWORK
2010年
14期
68-72
,共5页
数据库%记录%算法%类
數據庫%記錄%算法%類
수거고%기록%산법%류
由于数据来源复杂,日积月累,数据库中有很多重复数据.在"电话号码"和"手机号码"字段数据中,不单单只有号码,还有汉字等,有的记录甚至有二三个号码;本文根据以上实际情况,提出了一种查出"重复"数据的模糊匹配算法,算法的基本思路是:从记录中,单单取出数字号码,然后进行比对.在匹配算法设计中,考虑了影响程序运行的各种各样差错、数据"异构"的情况.
由于數據來源複雜,日積月纍,數據庫中有很多重複數據.在"電話號碼"和"手機號碼"字段數據中,不單單隻有號碼,還有漢字等,有的記錄甚至有二三箇號碼;本文根據以上實際情況,提齣瞭一種查齣"重複"數據的模糊匹配算法,算法的基本思路是:從記錄中,單單取齣數字號碼,然後進行比對.在匹配算法設計中,攷慮瞭影響程序運行的各種各樣差錯、數據"異構"的情況.
유우수거래원복잡,일적월루,수거고중유흔다중복수거.재"전화호마"화"수궤호마"자단수거중,불단단지유호마,환유한자등,유적기록심지유이삼개호마;본문근거이상실제정황,제출료일충사출"중복"수거적모호필배산법,산법적기본사로시:종기록중,단단취출수자호마,연후진행비대.재필배산법설계중,고필료영향정서운행적각충각양차착、수거"이구"적정황.