计算机应用
計算機應用
계산궤응용
Journal of Computer Applications
2015年
11期
3243-3246,3251
,共5页
王泽%张宏军%张睿%贺邓超
王澤%張宏軍%張睿%賀鄧超
왕택%장굉군%장예%하산초
遗传算法%聚类%密度%距离
遺傳算法%聚類%密度%距離
유전산법%취류%밀도%거리
genetic algorithm%clustering%density%distance
为解决聚类中心选择困难和数据点密度计算泛化能力弱的问题,提出一种基于遗传算法与密度及距离计算的聚类方法.该算法通过指数方法计算数据点密度,降低参数对算法性能的影响;用遗传算法搜索最优密度和距离阈值,同时引入惩罚因子,克服算法搜索域偏移从而提高收敛速度,寻找最优聚类中心,并用归属方法完成聚类.通过4组人工数据集和4组UCI数据集实验证明,该方法在RI指数、聚类精度、聚类纯度、召回率等4个聚类评价指标上都达到与K-means算法、快速搜索聚类算法和Max_Min_SD算法相当或更好的效果,算法是有效的.
為解決聚類中心選擇睏難和數據點密度計算汎化能力弱的問題,提齣一種基于遺傳算法與密度及距離計算的聚類方法.該算法通過指數方法計算數據點密度,降低參數對算法性能的影響;用遺傳算法搜索最優密度和距離閾值,同時引入懲罰因子,剋服算法搜索域偏移從而提高收斂速度,尋找最優聚類中心,併用歸屬方法完成聚類.通過4組人工數據集和4組UCI數據集實驗證明,該方法在RI指數、聚類精度、聚類純度、召迴率等4箇聚類評價指標上都達到與K-means算法、快速搜索聚類算法和Max_Min_SD算法相噹或更好的效果,算法是有效的.
위해결취류중심선택곤난화수거점밀도계산범화능력약적문제,제출일충기우유전산법여밀도급거리계산적취류방법.해산법통과지수방법계산수거점밀도,강저삼수대산법성능적영향;용유전산법수색최우밀도화거리역치,동시인입징벌인자,극복산법수색역편이종이제고수렴속도,심조최우취류중심,병용귀속방법완성취류.통과4조인공수거집화4조UCI수거집실험증명,해방법재RI지수、취류정도、취류순도、소회솔등4개취류평개지표상도체도여K-means산법、쾌속수색취류산법화Max_Min_SD산법상당혹경호적효과,산법시유효적.