计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2012年
10期
152-156
,共5页
离群点%数据挖掘%基于距离
離群點%數據挖掘%基于距離
리군점%수거알굴%기우거리
基于距离的离群点挖掘通常需要O(N2)的时间进行大量的距离计算与比较,这限制了其在海量数据上的应用.针对此问题,提出了一个带剪枝功能的离群点挖掘算法.算法分为两步:在对数据集进行一遍扫描后,剪枝掉大量的非离群点;然后对余下的可疑数据实施一种改进的嵌套循环算法,以每个数据点与其k个最近邻点的平均距离作为离群度,确定前n个离群点.在真实数据和合成数据集上的实验结果均表明,该算法在获得高命中率的同时仍保持低误警率.与相关算法相比,其具有较低的时间复杂性.
基于距離的離群點挖掘通常需要O(N2)的時間進行大量的距離計算與比較,這限製瞭其在海量數據上的應用.針對此問題,提齣瞭一箇帶剪枝功能的離群點挖掘算法.算法分為兩步:在對數據集進行一遍掃描後,剪枝掉大量的非離群點;然後對餘下的可疑數據實施一種改進的嵌套循環算法,以每箇數據點與其k箇最近鄰點的平均距離作為離群度,確定前n箇離群點.在真實數據和閤成數據集上的實驗結果均錶明,該算法在穫得高命中率的同時仍保持低誤警率.與相關算法相比,其具有較低的時間複雜性.
기우거리적리군점알굴통상수요O(N2)적시간진행대량적거리계산여비교,저한제료기재해량수거상적응용.침대차문제,제출료일개대전지공능적리군점알굴산법.산법분위량보:재대수거집진행일편소묘후,전지도대량적비리군점;연후대여하적가의수거실시일충개진적감투순배산법,이매개수거점여기k개최근린점적평균거리작위리군도,학정전n개리군점.재진실수거화합성수거집상적실험결과균표명,해산법재획득고명중솔적동시잉보지저오경솔.여상관산법상비,기구유교저적시간복잡성.