计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2009年
32期
117-119
,共3页
孤立点检测%层次聚类%数据预处理%数据挖掘
孤立點檢測%層次聚類%數據預處理%數據挖掘
고립점검측%층차취류%수거예처리%수거알굴
outlier detection%hierarchical clustering%data preprocessing%data mining
孤立点检测是数据挖掘过程的重要环节.提出了基于层次聚类的孤立点检测(ODHC)方法.ODHC方法基于层次聚类结果进行分析,对距离矩阵按簇间距离从大到小检测孤立点,可检测出指定离群程度的孤立点,直到达到用户对数据的集中性要求.该方法适用于多维数据集,且算法原理直观,用户友好,对孤立点的检测准确率较高.在iris、balloon等数据集上的仿真实验结果表明,ODHC方法能有效地识别孤立点,是一种简单实用的孤立点检测方法.
孤立點檢測是數據挖掘過程的重要環節.提齣瞭基于層次聚類的孤立點檢測(ODHC)方法.ODHC方法基于層次聚類結果進行分析,對距離矩陣按簇間距離從大到小檢測孤立點,可檢測齣指定離群程度的孤立點,直到達到用戶對數據的集中性要求.該方法適用于多維數據集,且算法原理直觀,用戶友好,對孤立點的檢測準確率較高.在iris、balloon等數據集上的倣真實驗結果錶明,ODHC方法能有效地識彆孤立點,是一種簡單實用的孤立點檢測方法.
고립점검측시수거알굴과정적중요배절.제출료기우층차취류적고립점검측(ODHC)방법.ODHC방법기우층차취류결과진행분석,대거리구진안족간거리종대도소검측고립점,가검측출지정리군정도적고립점,직도체도용호대수거적집중성요구.해방법괄용우다유수거집,차산법원리직관,용호우호,대고립점적검측준학솔교고.재iris、balloon등수거집상적방진실험결과표명,ODHC방법능유효지식별고립점,시일충간단실용적고립점검측방법.
Outlier detection is an important step of data mining,a new Outlier Detection method based on Hierarchical Clustering (ODHC) is proposed.ODHC method takes an analysis based on the results of hierarchical clustering,and detects outliers by the distance matrix in decending order of distance between clusters.Outlier in the specified degree of isolation can be detected, until it meets the user's requirement of data-intensive.This method is applicable to multi-dimensional data sets,and the algorithm is principle-intuitive,user-friendly,and high accuracy in outlier detection.Experimental results on iris and balloon data sets showthat ODHC method can effectively identify the outliers,and is a simple and applicable method of outliers detection.