情报学报
情報學報
정보학보
2013年
3期
306-313
,共8页
模糊C均值聚类%聚类有效性指标%大小和密度%COS指标
模糊C均值聚類%聚類有效性指標%大小和密度%COS指標
모호C균치취류%취류유효성지표%대소화밀도%COS지표
聚类有效性指标用于评价聚类质量和确定最佳聚类数,针对包含大小和密度差异性较大数据类的数据集,在分析了传统模糊聚类有效性指标不足的基础上,提出了一个同时考虑紧致性、重叠度和分离性的聚类有效性指标COS.类内紧致性用一定阈值内的隶属度之和与最大类内距离之比表示,一定阈值内各样本同属于两个类的隶属度差异反映了这两个类的重叠度,类间分离性的度量为最小类间距离,使COS指标值最大的聚类数即为最佳聚类数.在四个人工数据集和iris真实数据集上利用模糊C均值算法进行聚类实验的结果表明,COS指标可以有效发现小类和低密度类.
聚類有效性指標用于評價聚類質量和確定最佳聚類數,針對包含大小和密度差異性較大數據類的數據集,在分析瞭傳統模糊聚類有效性指標不足的基礎上,提齣瞭一箇同時攷慮緊緻性、重疊度和分離性的聚類有效性指標COS.類內緊緻性用一定閾值內的隸屬度之和與最大類內距離之比錶示,一定閾值內各樣本同屬于兩箇類的隸屬度差異反映瞭這兩箇類的重疊度,類間分離性的度量為最小類間距離,使COS指標值最大的聚類數即為最佳聚類數.在四箇人工數據集和iris真實數據集上利用模糊C均值算法進行聚類實驗的結果錶明,COS指標可以有效髮現小類和低密度類.
취류유효성지표용우평개취류질량화학정최가취류수,침대포함대소화밀도차이성교대수거류적수거집,재분석료전통모호취류유효성지표불족적기출상,제출료일개동시고필긴치성、중첩도화분리성적취류유효성지표COS.류내긴치성용일정역치내적대속도지화여최대류내거리지비표시,일정역치내각양본동속우량개류적대속도차이반영료저량개류적중첩도,류간분리성적도량위최소류간거리,사COS지표치최대적취류수즉위최가취류수.재사개인공수거집화iris진실수거집상이용모호C균치산법진행취류실험적결과표명,COS지표가이유효발현소류화저밀도류.