北京石油化工学院学报
北京石油化工學院學報
북경석유화공학원학보
JOURNAL OF BEIJING INSTITUTE OF PETRO-CHEMICAL TECHNOLOGY
2011年
4期
55-58
,共4页
k均值%聚类%初始中心点%优化
k均值%聚類%初始中心點%優化
k균치%취류%초시중심점%우화
k-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用.由于k-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果.针对k-means算法所存在的问题,构造了文本集合的相似度矩阵,基于平均相似度集合通过排序迭代优选出了初始中心点.实验表明此算法可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果.
k-means算法是一種重要的聚類算法,在網絡信息處理領域有著廣汎的應用.由于k-means算法終止于一箇跼部最優狀態,所以初始類中心點的選擇會在很大程度上影響其聚類效果.針對k-means算法所存在的問題,構造瞭文本集閤的相似度矩陣,基于平均相似度集閤通過排序迭代優選齣瞭初始中心點.實驗錶明此算法可以有效減少迭代次數併提高聚類精度,最終穫得較好的聚類效果.
k-means산법시일충중요적취류산법,재망락신식처리영역유착엄범적응용.유우k-means산법종지우일개국부최우상태,소이초시류중심점적선택회재흔대정도상영향기취류효과.침대k-means산법소존재적문제,구조료문본집합적상사도구진,기우평균상사도집합통과배서질대우선출료초시중심점.실험표명차산법가이유효감소질대차수병제고취류정도,최종획득교호적취류효과.