计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2013年
7期
1942-1945
,共4页
杨福萍%王洪国%董树霞%牛家洋%丁艳辉
楊福萍%王洪國%董樹霞%牛傢洋%丁豔輝
양복평%왕홍국%동수하%우가양%정염휘
层次聚类%K-均值%信息熵%距离和%离群点检测
層次聚類%K-均值%信息熵%距離和%離群點檢測
층차취류%K-균치%신식적%거리화%리군점검측
hierarchical clustering%K-means%information entropy%distance sum%outlier detection
针对基于距离的离群点检测算法受全局阈值的限制,只能检测全局离群点,提出了基于聚类划分的两阶段离群点检测算法挖掘局部离群点.首先基于凝聚层次聚类迭代出K-means所需的k值,然后再利用K-means的方法将数据集划分成若干个微聚类;其次为了提高挖掘效率,提出基于信息熵的聚类过滤机制,判定微聚类中是否包含离群点;最后从包含离群点的微聚类中利用基于距离的方法挖掘出相应的局部离群点.实验结果表明,该算法效率高、检测精度高、时间复杂度低.
針對基于距離的離群點檢測算法受全跼閾值的限製,隻能檢測全跼離群點,提齣瞭基于聚類劃分的兩階段離群點檢測算法挖掘跼部離群點.首先基于凝聚層次聚類迭代齣K-means所需的k值,然後再利用K-means的方法將數據集劃分成若榦箇微聚類;其次為瞭提高挖掘效率,提齣基于信息熵的聚類過濾機製,判定微聚類中是否包含離群點;最後從包含離群點的微聚類中利用基于距離的方法挖掘齣相應的跼部離群點.實驗結果錶明,該算法效率高、檢測精度高、時間複雜度低.
침대기우거리적리군점검측산법수전국역치적한제,지능검측전국리군점,제출료기우취류화분적량계단리군점검측산법알굴국부리군점.수선기우응취층차취류질대출K-means소수적k치,연후재이용K-means적방법장수거집화분성약간개미취류;기차위료제고알굴효솔,제출기우신식적적취류과려궤제,판정미취류중시부포함리군점;최후종포함리군점적미취류중이용기우거리적방법알굴출상응적국부리군점.실험결과표명,해산법효솔고、검측정도고、시간복잡도저.