沈阳建筑大学学报(自然科学版)
瀋暘建築大學學報(自然科學版)
침양건축대학학보(자연과학판)
JOURNAL OF SHENYANG JIANZHU UNIVERSITY(NATURAL SCIENCE)
2006年
1期
149-153
,共5页
刘大任%孙焕良%牛志成%朱叶丽
劉大任%孫煥良%牛誌成%硃葉麗
류대임%손환량%우지성%주협려
聚类%孤立点%SNN算法%LOF检测算法
聚類%孤立點%SNN算法%LOF檢測算法
취류%고립점%SNN산법%LOF검측산법
目的提出一种聚类分析的新算法,解决聚类和同时检测孤立点的问题.方法结合SNN算法和LOF算法给出新算法-SNN-LOF算法原理:(1)建立相似度矩阵;(2)去除噪声;(3)密度;(4)标记核心点;(5)计算每个数据点的lrd值;(6)由核心对象出发来形成一个聚;(7)取出被作为噪声的数据点;(8)计算被定义为噪声数据的LOF值,输出被视为孤立点的数据点.编制算法程序实现聚类和孤立点检测.结果用CURE数据集,DBSCAN聚类算法和SNN聚类算法结果相同,时间消耗是很接近的.但当数据上升到10 000以上时,SNN-LOF算法聚类的效率明显要高于DBSCAN算法,同时也检测到了孤立点.结论 SNN-LOF算法可以在聚类的同时发现孤立点.在大数据量时,SNN-LOF算法的聚类时间效率明显要高于DBSCAN算法.
目的提齣一種聚類分析的新算法,解決聚類和同時檢測孤立點的問題.方法結閤SNN算法和LOF算法給齣新算法-SNN-LOF算法原理:(1)建立相似度矩陣;(2)去除譟聲;(3)密度;(4)標記覈心點;(5)計算每箇數據點的lrd值;(6)由覈心對象齣髮來形成一箇聚;(7)取齣被作為譟聲的數據點;(8)計算被定義為譟聲數據的LOF值,輸齣被視為孤立點的數據點.編製算法程序實現聚類和孤立點檢測.結果用CURE數據集,DBSCAN聚類算法和SNN聚類算法結果相同,時間消耗是很接近的.但噹數據上升到10 000以上時,SNN-LOF算法聚類的效率明顯要高于DBSCAN算法,同時也檢測到瞭孤立點.結論 SNN-LOF算法可以在聚類的同時髮現孤立點.在大數據量時,SNN-LOF算法的聚類時間效率明顯要高于DBSCAN算法.
목적제출일충취류분석적신산법,해결취류화동시검측고립점적문제.방법결합SNN산법화LOF산법급출신산법-SNN-LOF산법원리:(1)건립상사도구진;(2)거제조성;(3)밀도;(4)표기핵심점;(5)계산매개수거점적lrd치;(6)유핵심대상출발래형성일개취;(7)취출피작위조성적수거점;(8)계산피정의위조성수거적LOF치,수출피시위고립점적수거점.편제산법정서실현취류화고립점검측.결과용CURE수거집,DBSCAN취류산법화SNN취류산법결과상동,시간소모시흔접근적.단당수거상승도10 000이상시,SNN-LOF산법취류적효솔명현요고우DBSCAN산법,동시야검측도료고립점.결론 SNN-LOF산법가이재취류적동시발현고립점.재대수거량시,SNN-LOF산법적취류시간효솔명현요고우DBSCAN산법.