计算机与现代化
計算機與現代化
계산궤여현대화
COMPUTER AND MODERNIZATION
2014年
6期
94-97
,共4页
聚类%FCM算法%数据场%初始聚类中心
聚類%FCM算法%數據場%初始聚類中心
취류%FCM산법%수거장%초시취류중심
clustering%fuzzy c-means algorithm%data field%initial cluster centers
FCM算法对初始聚类中心敏感,对噪声和孤立点敏感,容易受到数据分布的影响。本文的改进算法引入物理学上的数据场理论,用势函数来描述数据的分布,优化初始聚类中心;同时采用冗余聚类中心的方法,即将大簇分割成多个小类,再用分离度作为评估函数进行类合并。仿真实验结果表明,改进算法能够克服FCM算法的一些缺陷,对数据分布不规则的数据集进行有效聚类,聚类效果良好。
FCM算法對初始聚類中心敏感,對譟聲和孤立點敏感,容易受到數據分佈的影響。本文的改進算法引入物理學上的數據場理論,用勢函數來描述數據的分佈,優化初始聚類中心;同時採用冗餘聚類中心的方法,即將大簇分割成多箇小類,再用分離度作為評估函數進行類閤併。倣真實驗結果錶明,改進算法能夠剋服FCM算法的一些缺陷,對數據分佈不規則的數據集進行有效聚類,聚類效果良好。
FCM산법대초시취류중심민감,대조성화고립점민감,용역수도수거분포적영향。본문적개진산법인입물이학상적수거장이론,용세함수래묘술수거적분포,우화초시취류중심;동시채용용여취류중심적방법,즉장대족분할성다개소류,재용분리도작위평고함수진행류합병。방진실험결과표명,개진산법능구극복FCM산법적일사결함,대수거분포불규칙적수거집진행유효취류,취류효과량호。
The fuzzy c-means algorithm has several limitations:too sensitive to choose initial class center of divisions , too sensi-tive to noises and outliers , easy to be effected by data distributions .The improved algorithm uses the data field according to the theory of fields in physics , uses potential values of fault points in the data field to identify noise point and determine the initial class center , uses multicenters clustering algorithm that big cluster is cut into several small clusters , and then takes the separation measures as evaluation function to merge small clusters .Experiments show that the improved fuzzy c-means algorithm could make up the defects of fuzzy c-means algorithm , and be well suited to the non-uniform subject distributions .