计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
23期
166-168,182
,共4页
聚类%K-means算法%遗传算法
聚類%K-means算法%遺傳算法
취류%K-means산법%유전산법
一个好的K-means聚类算法至少要满足两个要求:(1)能反映聚类的有效性,即所分类别数要与实际问题相符;(2)具有处理噪声数据的能力.传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点.针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心.实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点.为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法(PKM)和遗传算法相结合的混合算法(PGKM),该算法在提高紧凑度(类内距)和分离度(类间距)的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类.实验证明该算法具有更好的聚类质量和综合性能.
一箇好的K-means聚類算法至少要滿足兩箇要求:(1)能反映聚類的有效性,即所分類彆數要與實際問題相符;(2)具有處理譟聲數據的能力.傳統的K-means算法是一種跼部搜索算法,存在著對初始化敏感和容易陷入跼部極值的缺點.針對此缺點,提齣瞭一種優化初始中心的K-means算法,該算法選擇相距最遠的處于高密度區域的k箇數據對象作為初始聚類中心.實驗錶明該算法不僅具有對初始數據的弱依賴性,而且具有收斂快,聚類質量高的特點.為體現聚類的有效性,穫得更高精度的聚類結果,提齣瞭將優化的K-means算法(PKM)和遺傳算法相結閤的混閤算法(PGKM),該算法在提高緊湊度(類內距)和分離度(類間距)的同時自動搜索最佳聚類數k,對k箇初始中心優化後再聚類,不斷地循環迭代,得到滿足終止條件的最優聚類.實驗證明該算法具有更好的聚類質量和綜閤性能.
일개호적K-means취류산법지소요만족량개요구:(1)능반영취류적유효성,즉소분유별수요여실제문제상부;(2)구유처리조성수거적능력.전통적K-means산법시일충국부수색산법,존재착대초시화민감화용역함입국부겁치적결점.침대차결점,제출료일충우화초시중심적K-means산법,해산법선택상거최원적처우고밀도구역적k개수거대상작위초시취류중심.실험표명해산법불부구유대초시수거적약의뢰성,이차구유수렴쾌,취류질량고적특점.위체현취류적유효성,획득경고정도적취류결과,제출료장우화적K-means산법(PKM)화유전산법상결합적혼합산법(PGKM),해산법재제고긴주도(류내거)화분리도(류간거)적동시자동수색최가취류수k,대k개초시중심우화후재취류,불단지순배질대,득도만족종지조건적최우취류.실험증명해산법구유경호적취류질량화종합성능.