计算机与数字工程
計算機與數字工程
계산궤여수자공정
COMPUTER & DIGITAL ENGINEERING
2014年
7期
1141-1145
,共5页
李光兴%唐俊%易林%徐彬
李光興%唐俊%易林%徐彬
리광흥%당준%역림%서빈
网格聚类%邻接单元%判别函数%相似阈值%参数计算
網格聚類%鄰接單元%判彆函數%相似閾值%參數計算
망격취류%린접단원%판별함수%상사역치%삼수계산
grid clustering%adjacent unit%discriminant function%similar threshold%parameter calculation
针对多密度数据集聚类的时间复杂度过高和聚类结果对参数设置的依赖性过强的问题,提出了一种自动计算参数的多密度网格聚类算法MGCP ,该方法用网格单元的密度和单元间质心距离来构造判别函数,用判别函数的统计信息自动确定参数。实验结果表明,MGCP算法能够有效处理任意形状和不同密度的类,以较小的时间代价获得较高的聚类精度。
針對多密度數據集聚類的時間複雜度過高和聚類結果對參數設置的依賴性過彊的問題,提齣瞭一種自動計算參數的多密度網格聚類算法MGCP ,該方法用網格單元的密度和單元間質心距離來構造判彆函數,用判彆函數的統計信息自動確定參數。實驗結果錶明,MGCP算法能夠有效處理任意形狀和不同密度的類,以較小的時間代價穫得較高的聚類精度。
침대다밀도수거집취류적시간복잡도과고화취류결과대삼수설치적의뢰성과강적문제,제출료일충자동계산삼수적다밀도망격취류산법MGCP ,해방법용망격단원적밀도화단원간질심거리래구조판별함수,용판별함수적통계신식자동학정삼수。실험결과표명,MGCP산법능구유효처리임의형상화불동밀도적류,이교소적시간대개획득교고적취류정도。
Aiming to address the issues of excessive reliance of parameters and long processing time resulted from the high complexity in clustering of multi-density data set ,a multi-density grid clustering algorithm to calculate parameters auto-matically(MGCP) is proposed .This method uses the discriminant function ,which is based on the unit density and the unit centroid distance ,to automatically determine the similar threshold according to the statistical information of discriminant function .The experimental results indicate the MGCP algorithm can effectively process the class with arbitrary shape or dif-ferent densities .This algorithm can achieve a higher cluster precision in a shorter time span .