CAJ | 학술논문

针对传统K-means聚类算法对初始中心点比较敏感、易陷入局部最优,首先提出基于KD-树的初始聚类中心点选取方法.该方法通过建立KD-树将数据集分割成矩形单元,计算每个矩形的矩形单元中心、矩形单元密度,并将计算所得矩形单元密度降序排列,通过选取前k个矩形单元中心作为初始聚类中心,可有效克服传统算法对初始中心点的敏感.此外,针对传统K-means聚类算法不能有效处理动态数据聚类的问题,进一步提出了KDTK-means聚类算法.该算法对基于KD-树优化选取的k个聚类中心和增量数据建立新的KD-树,利用近邻搜索策略将增量数据分配到相应的聚类簇中并完成聚类.实验结果表明,与传统的K-means聚类算法相比,提出的基于KD-树优化初始聚类中心点选取的算法能够有效选取具有代表性的初始中心,提出的KDTK-means聚类算法能够快速高效地处理增量数据聚类问题.
침대전통K-means취류산법대초시중심점비교민감、역함입국부최우,수선제출기우KD-수적초시취류중심점선취방법.해방법통과건립KD-수장수거집분할성구형단원,계산매개구형적구형단원중심、구형단원밀도,병장계산소득구형단원밀도강서배렬,통과선취전k개구형단원중심작위초시취류중심,가유효극복전통산법대초시중심점적민감.차외,침대전통K-means취류산법불능유효처리동태수거취류적문제,진일보제출료KDTK-means취류산법.해산법대기우KD-수우화선취적k개취류중심화증량수거건립신적KD-수,이용근린수색책략장증량수거분배도상응적취류족중병완성취류.실험결과표명,여전통적K-means취류산법상비,제출적기우KD-수우화초시취류중심점선취적산법능구유효선취구유대표성적초시중심,제출적KDTK-means취류산법능구쾌속고효지처리증량수거취류문제.