天津大学学报
天津大學學報
천진대학학보
JOURNAL OF TIANJIN UNIVERSITY SCIENCE AND TECHNOLOGY
2010年
7期
606-610
,共5页
相似重复记录%Apriori算法%FRMA算法
相似重複記錄%Apriori算法%FRMA算法
상사중복기록%Apriori산법%FRMA산법
为消除在数据库中存在的中文相似重复记录,提出一种改进的Apriori算法,利用该算法获得数据库记录的频繁项集.基于频繁项集,消除进行比较记录的共有项,有效提高相异字符的计算权重.然后利用FRMA算法计算记录间的相似度,最终消除中文相似记录.在车辆检测数据库中对该算法进行了实验,取得了较好的实验结果,证明该算法具有较好的实用价值.
為消除在數據庫中存在的中文相似重複記錄,提齣一種改進的Apriori算法,利用該算法穫得數據庫記錄的頻繁項集.基于頻繁項集,消除進行比較記錄的共有項,有效提高相異字符的計算權重.然後利用FRMA算法計算記錄間的相似度,最終消除中文相似記錄.在車輛檢測數據庫中對該算法進行瞭實驗,取得瞭較好的實驗結果,證明該算法具有較好的實用價值.
위소제재수거고중존재적중문상사중복기록,제출일충개진적Apriori산법,이용해산법획득수거고기록적빈번항집.기우빈번항집,소제진행비교기록적공유항,유효제고상이자부적계산권중.연후이용FRMA산법계산기록간적상사도,최종소제중문상사기록.재차량검측수거고중대해산법진행료실험,취득료교호적실험결과,증명해산법구유교호적실용개치.