华南理工大学学报(自然科学版)
華南理工大學學報(自然科學版)
화남리공대학학보(자연과학판)
JOURNAL OF SOUTH CHINA UNIVERSITY OF TECHNOLOGY(NATURAL SCIENCE EDITION)
2009年
4期
18-23,45
,共7页
戴维迪%张璐%王文俊%侯越先
戴維迪%張璐%王文俊%侯越先
대유적%장로%왕문준%후월선
聚类%密度%网格%距离%跃迁函数
聚類%密度%網格%距離%躍遷函數
취류%밀도%망격%거리%약천함수
真实数据集通常密度分布不均,多数基于网格和密度的聚类算法采用的单调性搜索方法难以形成有效聚类.为此,文中提出了基于网格密度和距离信息特征的聚类算法(GDD).该算法将数据空间划分成网格单元,并构建基于簇中心距离信息的跃迁函数,通过考察局域范围内网格单元的密度跃迁比,并比对计算出的当前网格单元的跃迁函数值,以决定是否继续扩展和增长聚类簇规模.具体的跃迁函数在真实和模拟集上的实验结果表明:GDD算法能够发现任意形状的簇,对噪音数据不敏感,且具有线性于网格数目的时间复杂性,适合对大规模真实数据集的聚类.
真實數據集通常密度分佈不均,多數基于網格和密度的聚類算法採用的單調性搜索方法難以形成有效聚類.為此,文中提齣瞭基于網格密度和距離信息特徵的聚類算法(GDD).該算法將數據空間劃分成網格單元,併構建基于簇中心距離信息的躍遷函數,通過攷察跼域範圍內網格單元的密度躍遷比,併比對計算齣的噹前網格單元的躍遷函數值,以決定是否繼續擴展和增長聚類簇規模.具體的躍遷函數在真實和模擬集上的實驗結果錶明:GDD算法能夠髮現任意形狀的簇,對譟音數據不敏感,且具有線性于網格數目的時間複雜性,適閤對大規模真實數據集的聚類.
진실수거집통상밀도분포불균,다수기우망격화밀도적취류산법채용적단조성수색방법난이형성유효취류.위차,문중제출료기우망격밀도화거리신식특정적취류산법(GDD).해산법장수거공간화분성망격단원,병구건기우족중심거리신식적약천함수,통과고찰국역범위내망격단원적밀도약천비,병비대계산출적당전망격단원적약천함수치,이결정시부계속확전화증장취류족규모.구체적약천함수재진실화모의집상적실험결과표명:GDD산법능구발현임의형상적족,대조음수거불민감,차구유선성우망격수목적시간복잡성,괄합대대규모진실수거집적취류.