计算机应用研究
計算機應用研究
계산궤응용연구
Application Research of Computers
2015年
12期
3590-3595
,共6页
万静%张义%何云斌%李松
萬靜%張義%何雲斌%李鬆
만정%장의%하운빈%리송
K-means聚类%KD-树%增量聚类%初始聚类中心
K-means聚類%KD-樹%增量聚類%初始聚類中心
K-means취류%KD-수%증량취류%초시취류중심
K-means clustering%KD-tree%incremental clustering%initial clustering center
针对传统K-means聚类算法对初始中心点比较敏感、易陷入局部最优,首先提出基于KD-树的初始聚类中心点选取方法.该方法通过建立KD-树将数据集分割成矩形单元,计算每个矩形的矩形单元中心、矩形单元密度,并将计算所得矩形单元密度降序排列,通过选取前k个矩形单元中心作为初始聚类中心,可有效克服传统算法对初始中心点的敏感.此外,针对传统K-means聚类算法不能有效处理动态数据聚类的问题,进一步提出了KDTK-means聚类算法.该算法对基于KD-树优化选取的k个聚类中心和增量数据建立新的KD-树,利用近邻搜索策略将增量数据分配到相应的聚类簇中并完成聚类.实验结果表明,与传统的K-means聚类算法相比,提出的基于KD-树优化初始聚类中心点选取的算法能够有效选取具有代表性的初始中心,提出的KDTK-means聚类算法能够快速高效地处理增量数据聚类问题.
針對傳統K-means聚類算法對初始中心點比較敏感、易陷入跼部最優,首先提齣基于KD-樹的初始聚類中心點選取方法.該方法通過建立KD-樹將數據集分割成矩形單元,計算每箇矩形的矩形單元中心、矩形單元密度,併將計算所得矩形單元密度降序排列,通過選取前k箇矩形單元中心作為初始聚類中心,可有效剋服傳統算法對初始中心點的敏感.此外,針對傳統K-means聚類算法不能有效處理動態數據聚類的問題,進一步提齣瞭KDTK-means聚類算法.該算法對基于KD-樹優化選取的k箇聚類中心和增量數據建立新的KD-樹,利用近鄰搜索策略將增量數據分配到相應的聚類簇中併完成聚類.實驗結果錶明,與傳統的K-means聚類算法相比,提齣的基于KD-樹優化初始聚類中心點選取的算法能夠有效選取具有代錶性的初始中心,提齣的KDTK-means聚類算法能夠快速高效地處理增量數據聚類問題.
침대전통K-means취류산법대초시중심점비교민감、역함입국부최우,수선제출기우KD-수적초시취류중심점선취방법.해방법통과건립KD-수장수거집분할성구형단원,계산매개구형적구형단원중심、구형단원밀도,병장계산소득구형단원밀도강서배렬,통과선취전k개구형단원중심작위초시취류중심,가유효극복전통산법대초시중심점적민감.차외,침대전통K-means취류산법불능유효처리동태수거취류적문제,진일보제출료KDTK-means취류산법.해산법대기우KD-수우화선취적k개취류중심화증량수거건립신적KD-수,이용근린수색책략장증량수거분배도상응적취류족중병완성취류.실험결과표명,여전통적K-means취류산법상비,제출적기우KD-수우화초시취류중심점선취적산법능구유효선취구유대표성적초시중심,제출적KDTK-means취류산법능구쾌속고효지처리증량수거취류문제.