计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2014年
8期
2166-2169
,共4页
郑宏亮%徐本强%赵晓慧%邹丽
鄭宏亮%徐本彊%趙曉慧%鄒麗
정굉량%서본강%조효혜%추려
模糊聚类%模糊C均值算法%有效性指标%模糊因子%最佳聚类数
模糊聚類%模糊C均值算法%有效性指標%模糊因子%最佳聚類數
모호취류%모호C균치산법%유효성지표%모호인자%최가취류수
fuzzy clustering%Fuzzy C-Means (FCM) algorithm%validity index%fuzzy factor%optimal cluster number
在经典的模糊C均值(FCM)算法中,聚类数需要预先给出,否则算法无法工作,这在一定程度上限制了FCM算法的应用范围.针对FCM算法中聚类数需要预先设定问题,提出了一种新的模糊聚类有效性指标.首先,通过运行FCM算法得到隶属度矩阵;然后,通过隶属度矩阵计算类内紧密性和类间重叠性;最后,利用类内的紧密性和类间的重叠性定义了一个新的聚类有效性指标.该指标克服了FCM算法中类数需要预先设定的缺点,利用该指标可以发现最符合数据自然分布的类的数目.通过对人工数据集和实际数据集的测试表明,对于模糊因子取1.8,2.0和2.2三个不同的常用值,均能发现最优聚类数.
在經典的模糊C均值(FCM)算法中,聚類數需要預先給齣,否則算法無法工作,這在一定程度上限製瞭FCM算法的應用範圍.針對FCM算法中聚類數需要預先設定問題,提齣瞭一種新的模糊聚類有效性指標.首先,通過運行FCM算法得到隸屬度矩陣;然後,通過隸屬度矩陣計算類內緊密性和類間重疊性;最後,利用類內的緊密性和類間的重疊性定義瞭一箇新的聚類有效性指標.該指標剋服瞭FCM算法中類數需要預先設定的缺點,利用該指標可以髮現最符閤數據自然分佈的類的數目.通過對人工數據集和實際數據集的測試錶明,對于模糊因子取1.8,2.0和2.2三箇不同的常用值,均能髮現最優聚類數.
재경전적모호C균치(FCM)산법중,취류수수요예선급출,부칙산법무법공작,저재일정정도상한제료FCM산법적응용범위.침대FCM산법중취류수수요예선설정문제,제출료일충신적모호취류유효성지표.수선,통과운행FCM산법득도대속도구진;연후,통과대속도구진계산류내긴밀성화류간중첩성;최후,이용류내적긴밀성화류간적중첩성정의료일개신적취류유효성지표.해지표극복료FCM산법중류수수요예선설정적결점,이용해지표가이발현최부합수거자연분포적류적수목.통과대인공수거집화실제수거집적측시표명,대우모호인자취1.8,2.0화2.2삼개불동적상용치,균능발현최우취류수.