科技信息
科技信息
과기신식
SCIENTIFIC & TECHNICAL INFORMATION
2010年
32期
136-137
,共2页
K均值聚类%聚类中心%数据挖掘
K均值聚類%聚類中心%數據挖掘
K균치취류%취류중심%수거알굴
k均值算法是聚类方法中常用的一种划分方法,有很多优点,但也存在不足之处,它对球状、凸形分布的数据具有很好的聚类效果,但对样本的输入顺序敏感,可能产生局部最优解,而且受孤立点影响比较大.本文针对这些不足之处,主要从数据预处理,初始聚类中心的选择和迭代过程聚类种子计算三方面进行改进,并做了改进前后算法的对比实验.结果表明,改进后的算法比原k均值算法具有更高的准确性,受孤立点的影响也大大降低.
k均值算法是聚類方法中常用的一種劃分方法,有很多優點,但也存在不足之處,它對毬狀、凸形分佈的數據具有很好的聚類效果,但對樣本的輸入順序敏感,可能產生跼部最優解,而且受孤立點影響比較大.本文針對這些不足之處,主要從數據預處理,初始聚類中心的選擇和迭代過程聚類種子計算三方麵進行改進,併做瞭改進前後算法的對比實驗.結果錶明,改進後的算法比原k均值算法具有更高的準確性,受孤立點的影響也大大降低.
k균치산법시취류방법중상용적일충화분방법,유흔다우점,단야존재불족지처,타대구상、철형분포적수거구유흔호적취류효과,단대양본적수입순서민감,가능산생국부최우해,이차수고립점영향비교대.본문침대저사불족지처,주요종수거예처리,초시취류중심적선택화질대과정취류충자계산삼방면진행개진,병주료개진전후산법적대비실험.결과표명,개진후적산법비원k균치산법구유경고적준학성,수고립점적영향야대대강저.