地球信息科学
地毬信息科學
지구신식과학
GEO-INFORMATION SCIENCE
2008年
5期
586-592
,共7页
林甲祥%陈崇成%樊明辉%郑旻琦
林甲祥%陳崇成%樊明輝%鄭旻琦
림갑상%진숭성%번명휘%정민기
SOM算法%聚类的离群%空间离群%MST聚类
SOM算法%聚類的離群%空間離群%MST聚類
SOM산법%취류적리군%공간리군%MST취류
空间离群是指空间邻域中属性特征值明显不同于其他对象的空间对象,空间数据离群挖掘能为人们提供很多有趣的信息,但空间数据具有复杂的拓扑关系、方位关系和度量关系等空间特征,传统的面向事务型数据库的离群挖掘算法并不适用于空间数据库.本文提出了基于MST(Minimum Spanning Tree,最小生成树)聚类的空间数据离群挖掘算法(SOM);有机结合了最小生成树理论与密度的方法,既体现了空间离群的局部特性,又体现了空间离群的孤立程度.该算法通过MST维护空间数据的基本空间结构特征,通过打断MST中最不一致的边形成MST聚类,不仅具有密度的聚类方法能够聚集非球状簇和分布不均的数据集的特点,而且聚类结果不依赖于用户参数的选择,因此,离群挖掘结果更合理.最后,通过实例数据,验证了该算法的有效性,它适用于大规模空间数据集的离群挖掘.
空間離群是指空間鄰域中屬性特徵值明顯不同于其他對象的空間對象,空間數據離群挖掘能為人們提供很多有趣的信息,但空間數據具有複雜的拓撲關繫、方位關繫和度量關繫等空間特徵,傳統的麵嚮事務型數據庫的離群挖掘算法併不適用于空間數據庫.本文提齣瞭基于MST(Minimum Spanning Tree,最小生成樹)聚類的空間數據離群挖掘算法(SOM);有機結閤瞭最小生成樹理論與密度的方法,既體現瞭空間離群的跼部特性,又體現瞭空間離群的孤立程度.該算法通過MST維護空間數據的基本空間結構特徵,通過打斷MST中最不一緻的邊形成MST聚類,不僅具有密度的聚類方法能夠聚集非毬狀簇和分佈不均的數據集的特點,而且聚類結果不依賴于用戶參數的選擇,因此,離群挖掘結果更閤理.最後,通過實例數據,驗證瞭該算法的有效性,它適用于大規模空間數據集的離群挖掘.
공간리군시지공간린역중속성특정치명현불동우기타대상적공간대상,공간수거리군알굴능위인문제공흔다유취적신식,단공간수거구유복잡적탁복관계、방위관계화도량관계등공간특정,전통적면향사무형수거고적리군알굴산법병불괄용우공간수거고.본문제출료기우MST(Minimum Spanning Tree,최소생성수)취류적공간수거리군알굴산법(SOM);유궤결합료최소생성수이론여밀도적방법,기체현료공간리군적국부특성,우체현료공간리군적고립정도.해산법통과MST유호공간수거적기본공간결구특정,통과타단MST중최불일치적변형성MST취류,불부구유밀도적취류방법능구취집비구상족화분포불균적수거집적특점,이차취류결과불의뢰우용호삼수적선택,인차,리군알굴결과경합리.최후,통과실례수거,험증료해산법적유효성,타괄용우대규모공간수거집적리군알굴.