河北工业科技
河北工業科技
하북공업과기
HEBEI JOURNAL OF INDUSTRIAL SCIENCE & TECHNOLOGY
2015年
2期
123-128
,共6页
周其林%雷菊阳%王昱栋%张兰兰
週其林%雷菊暘%王昱棟%張蘭蘭
주기림%뢰국양%왕욱동%장란란
算法理论%聚类算法%k-均值%惩罚参数%递增思想%全局性
算法理論%聚類算法%k-均值%懲罰參數%遞增思想%全跼性
산법이론%취류산법%k-균치%징벌삼수%체증사상%전국성
algorithm theory%clustering algorithm%k-means%penalty parameter%incremental theory%global
针对传统k-均值聚类算法的两大缺点,即算法中需要知道确定的聚类数和初始种群选取的随机性,提出了一种新的聚类算法,即基于k-均值聚类算法的无需确定聚类数的聚类算法.这种算法是基于递增思想的聚类算法,最大的特色是无需事先知道聚类数,初始聚类数取1,初始聚类中心为所有数据点的聚类中心,算法中首先设定一个惩罚参数,对于确定的惩罚参数,运算时聚类数逐渐增加,直到收敛,即聚类数不再发生变化,就得到了所需的聚类数以及最终的聚类结果.运用于茶叶分类和各省市平均工资水平分析的2个实验也验证了这种算法的可行性,通过实验可知,这种聚类算法具有较好的全局收敛能力和较高的正确率,稳定性强,收敛速度快.
針對傳統k-均值聚類算法的兩大缺點,即算法中需要知道確定的聚類數和初始種群選取的隨機性,提齣瞭一種新的聚類算法,即基于k-均值聚類算法的無需確定聚類數的聚類算法.這種算法是基于遞增思想的聚類算法,最大的特色是無需事先知道聚類數,初始聚類數取1,初始聚類中心為所有數據點的聚類中心,算法中首先設定一箇懲罰參數,對于確定的懲罰參數,運算時聚類數逐漸增加,直到收斂,即聚類數不再髮生變化,就得到瞭所需的聚類數以及最終的聚類結果.運用于茶葉分類和各省市平均工資水平分析的2箇實驗也驗證瞭這種算法的可行性,通過實驗可知,這種聚類算法具有較好的全跼收斂能力和較高的正確率,穩定性彊,收斂速度快.
침대전통k-균치취류산법적량대결점,즉산법중수요지도학정적취류수화초시충군선취적수궤성,제출료일충신적취류산법,즉기우k-균치취류산법적무수학정취류수적취류산법.저충산법시기우체증사상적취류산법,최대적특색시무수사선지도취류수,초시취류수취1,초시취류중심위소유수거점적취류중심,산법중수선설정일개징벌삼수,대우학정적징벌삼수,운산시취류수축점증가,직도수렴,즉취류수불재발생변화,취득도료소수적취류수이급최종적취류결과.운용우다협분류화각성시평균공자수평분석적2개실험야험증료저충산법적가행성,통과실험가지,저충취류산법구유교호적전국수렴능력화교고적정학솔,은정성강,수렴속도쾌.