计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
29期
171-173
,共3页
相似重复记录%N-gram%入侵检测系统
相似重複記錄%N-gram%入侵檢測繫統
상사중복기록%N-gram%입침검측계통
数据清理是构建数据仓库中的一个重要研究领域.检测相似重复记录是数据清洗中一项非常重要的任务.提出了一种聚类检测相似重复记录的新方法,该方法是基于N-gram将关系表中的记录映射到高维空间中,并且通过可调密度的改进型DBSCAN算法IDS来聚类检测相似重复记录.并用实验证明了这种方法的有效性.
數據清理是構建數據倉庫中的一箇重要研究領域.檢測相似重複記錄是數據清洗中一項非常重要的任務.提齣瞭一種聚類檢測相似重複記錄的新方法,該方法是基于N-gram將關繫錶中的記錄映射到高維空間中,併且通過可調密度的改進型DBSCAN算法IDS來聚類檢測相似重複記錄.併用實驗證明瞭這種方法的有效性.
수거청리시구건수거창고중적일개중요연구영역.검측상사중복기록시수거청세중일항비상중요적임무.제출료일충취류검측상사중복기록적신방법,해방법시기우N-gram장관계표중적기록영사도고유공간중,병차통과가조밀도적개진형DBSCAN산법IDS래취류검측상사중복기록.병용실험증명료저충방법적유효성.