计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2012年
9期
101-103,107
,共4页
孤立点检测%层次聚类%数据挖掘
孤立點檢測%層次聚類%數據挖掘
고립점검측%층차취류%수거알굴
孤立数据的存在使数据挖掘结果不准确,甚至错误.现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,为此,提出一种有效的全局孤立点检测方法,该方法进行凝聚层次聚类,根据聚类树和距离矩阵来可视化判断数据孤立程度,确定孤立点数目.从聚类树自顶向下,无监督地去除离群数据点.在多个数据集上的仿真实验结果表明,该方法能有效识别孤立程度最大的前n个全局孤立点,适用于不同形状的数据集,算法效率高,用户友好,且适用于大型高维数据集的孤立点检测.
孤立數據的存在使數據挖掘結果不準確,甚至錯誤.現有的孤立點檢測算法在通用性、有效性、用戶友好性及處理高維大數據集的性能還不完善,為此,提齣一種有效的全跼孤立點檢測方法,該方法進行凝聚層次聚類,根據聚類樹和距離矩陣來可視化判斷數據孤立程度,確定孤立點數目.從聚類樹自頂嚮下,無鑑督地去除離群數據點.在多箇數據集上的倣真實驗結果錶明,該方法能有效識彆孤立程度最大的前n箇全跼孤立點,適用于不同形狀的數據集,算法效率高,用戶友好,且適用于大型高維數據集的孤立點檢測.
고립수거적존재사수거알굴결과불준학,심지착오.현유적고립점검측산법재통용성、유효성、용호우호성급처리고유대수거집적성능환불완선,위차,제출일충유효적전국고립점검측방법,해방법진행응취층차취류,근거취류수화거리구진래가시화판단수거고립정도,학정고립점수목.종취류수자정향하,무감독지거제리군수거점.재다개수거집상적방진실험결과표명,해방법능유효식별고립정도최대적전n개전국고립점,괄용우불동형상적수거집,산법효솔고,용호우호,차괄용우대형고유수거집적고립점검측.