系统工程理论与实践
繫統工程理論與實踐
계통공정이론여실천
SYSTEMS ENGINEERING--THEORY & PRACTICE
2008年
7期
125-131,137
,共8页
曾东海%MI Hong%刘力丰
曾東海%MI Hong%劉力豐
증동해%MI Hong%류력봉
聚类%网格密度%空间划分树
聚類%網格密度%空間劃分樹
취류%망격밀도%공간화분수
基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.文章提出了一种新的基于网格密度和空间划分树的CGDSFF(Clustering based on Grid - Density andSpatial Partition Tree)聚类算法.其创新点在于,将数据空间划分成多个体积相等的单元格,然后基于单元格定义了密度、簇等概念,对单元格建立了一种基于空间划分的空间索引结构(空间划分树)来对数据进行聚类.CGDSPT算法保持了基于密度的聚类算法的上述优点,而且CGDSFF算法具有线性的时间复杂性,因此CGDSPT算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CGDSPT算法的优点.
基于密度的聚類是聚類分析中的一種,其主要優點是髮現任意形狀的聚類和對譟音數據不敏感.文章提齣瞭一種新的基于網格密度和空間劃分樹的CGDSFF(Clustering based on Grid - Density andSpatial Partition Tree)聚類算法.其創新點在于,將數據空間劃分成多箇體積相等的單元格,然後基于單元格定義瞭密度、簇等概唸,對單元格建立瞭一種基于空間劃分的空間索引結構(空間劃分樹)來對數據進行聚類.CGDSPT算法保持瞭基于密度的聚類算法的上述優點,而且CGDSFF算法具有線性的時間複雜性,因此CGDSPT算法適閤對大規模數據的挖掘.理論分析和實驗結果也證明瞭CGDSPT算法的優點.
기우밀도적취류시취류분석중적일충,기주요우점시발현임의형상적취류화대조음수거불민감.문장제출료일충신적기우망격밀도화공간화분수적CGDSFF(Clustering based on Grid - Density andSpatial Partition Tree)취류산법.기창신점재우,장수거공간화분성다개체적상등적단원격,연후기우단원격정의료밀도、족등개념,대단원격건립료일충기우공간화분적공간색인결구(공간화분수)래대수거진행취류.CGDSPT산법보지료기우밀도적취류산법적상술우점,이차CGDSFF산법구유선성적시간복잡성,인차CGDSPT산법괄합대대규모수거적알굴.이론분석화실험결과야증명료CGDSPT산법적우점.