计算机应用研究
計算機應用研究
계산궤응용연구
APPLICATION RESEARCH OF COMPUTERS
2015年
1期
30-34
,共5页
局部方差%Num-近邻%邻域%初始聚类中心%聚类
跼部方差%Num-近鄰%鄰域%初始聚類中心%聚類
국부방차%Num-근린%린역%초시취류중심%취류
local variance%Num-nearneighbour%neibourhood%initial seeds%clustering
针对K-medoids聚类算法对初始聚类中心敏感、聚类结果依赖于初始聚类中心的缺陷,提出一种局部方差优化的K-medoids聚类算法,以期使K-medoids的初始聚类中心分布在不同的样本密集区域,聚类结果尽可能地收敛到全局最优解.该算法引入局部方差的概念,根据样本所处位置的局部样本分布定义样本的局部方差,以样本局部标准差为邻域半径,选取局部方差最小且位于不同区域的样本作为K-medoids的初始中心,充分利用了方差所提供的样本分布信息.在规模大小不等的UCI数据集以及带有不同比例噪声的不同规模的人工模拟数据集上进行实验,并利用六种聚类算法性能测试指标进行测试,结果表明该算法具有聚类效果好、抗噪性能强的优点,而且适用于大规模数据集的聚类.提出的Num-近邻方差优化的K-medoids聚类算法优于快速K-me-doids聚类算法及基于邻域的改进K-medoids聚类算法.
針對K-medoids聚類算法對初始聚類中心敏感、聚類結果依賴于初始聚類中心的缺陷,提齣一種跼部方差優化的K-medoids聚類算法,以期使K-medoids的初始聚類中心分佈在不同的樣本密集區域,聚類結果儘可能地收斂到全跼最優解.該算法引入跼部方差的概唸,根據樣本所處位置的跼部樣本分佈定義樣本的跼部方差,以樣本跼部標準差為鄰域半徑,選取跼部方差最小且位于不同區域的樣本作為K-medoids的初始中心,充分利用瞭方差所提供的樣本分佈信息.在規模大小不等的UCI數據集以及帶有不同比例譟聲的不同規模的人工模擬數據集上進行實驗,併利用六種聚類算法性能測試指標進行測試,結果錶明該算法具有聚類效果好、抗譟性能彊的優點,而且適用于大規模數據集的聚類.提齣的Num-近鄰方差優化的K-medoids聚類算法優于快速K-me-doids聚類算法及基于鄰域的改進K-medoids聚類算法.
침대K-medoids취류산법대초시취류중심민감、취류결과의뢰우초시취류중심적결함,제출일충국부방차우화적K-medoids취류산법,이기사K-medoids적초시취류중심분포재불동적양본밀집구역,취류결과진가능지수렴도전국최우해.해산법인입국부방차적개념,근거양본소처위치적국부양본분포정의양본적국부방차,이양본국부표준차위린역반경,선취국부방차최소차위우불동구역적양본작위K-medoids적초시중심,충분이용료방차소제공적양본분포신식.재규모대소불등적UCI수거집이급대유불동비례조성적불동규모적인공모의수거집상진행실험,병이용륙충취류산법성능측시지표진행측시,결과표명해산법구유취류효과호、항조성능강적우점,이차괄용우대규모수거집적취류.제출적Num-근린방차우화적K-medoids취류산법우우쾌속K-me-doids취류산법급기우린역적개진K-medoids취류산법.