CAJ | 학술논문

一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力.传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点.针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心.实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点.为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类.实验证明该算法具有更好的聚类质量和综合性能.
일개호적K-means취류산법지소요만족량개요구:(1)능반영취류적유효성,즉소분유별수요여실제문제상부;(2)구유처리조성수거적능력.전통적K-means산법시일충국부수색산법,존재착대초시화민감화용역함입국부겁치적결점.침대차결점,제출료일충우화초시중심적K-means산법,해산법선택상거최원적처우고밀도구역적k개수거대상작위초시취류중심.실험표명해산법불부구유대초시수거적약의뢰성,이차구유수렴쾌,취류질량고적특점.위체현취류적유효성,획득경고정도적취류결과,제출료장우화적K-means산법(PKM)화유전산법상결합적혼합산법(PGKM),해산법재제고긴주도(류내거)화분리도(류간거)적동시자동수색최가취류수k,대k개초시중심우화후재취류,불단지순배질대,득도만족종지조건적최우취류.실험증명해산법구유경호적취류질량화종합성능.