东南大学学报(自然科学版)
東南大學學報(自然科學版)
동남대학학보(자연과학판)
JOURNAL OF SOUTHEAST UNIVERSITY
2011年
3期
505-508
,共4页
於跃成%王建东%郑关胜%陈斌
於躍成%王建東%鄭關勝%陳斌
어약성%왕건동%정관성%진빈
k-means%并行k-means%约束聚类%约束并行k-means
k-means%併行k-means%約束聚類%約束併行k-means
k-means%병행k-means%약속취류%약속병행k-means
为获得分布式数据集上用户所期望的聚类结果,提出了基于约束信息的并行k-means聚类算法.在分析并行k-means能够有效实现对水平分布式数据集进行聚类的基础上,修改并行k-means算法的目标函数,设计约束并行k-means算法,将站点用户的约束信息以chunklet的形式引入到分布式聚类过程,从而引导算法执行有偏搜索.约束并行k-means算法在理论上保证无约束样本簇内距离最小的同时能够确保chunklet约束中的样本与对应的簇中心之间的平均距离最小.实验结果表明,约束并行k-means算法能够有效改善并行k-means的聚类精度,同时在分布式环境下能够得到与已有约束聚类算法在集中式数据集上相等价的聚类结果.
為穫得分佈式數據集上用戶所期望的聚類結果,提齣瞭基于約束信息的併行k-means聚類算法.在分析併行k-means能夠有效實現對水平分佈式數據集進行聚類的基礎上,脩改併行k-means算法的目標函數,設計約束併行k-means算法,將站點用戶的約束信息以chunklet的形式引入到分佈式聚類過程,從而引導算法執行有偏搜索.約束併行k-means算法在理論上保證無約束樣本簇內距離最小的同時能夠確保chunklet約束中的樣本與對應的簇中心之間的平均距離最小.實驗結果錶明,約束併行k-means算法能夠有效改善併行k-means的聚類精度,同時在分佈式環境下能夠得到與已有約束聚類算法在集中式數據集上相等價的聚類結果.
위획득분포식수거집상용호소기망적취류결과,제출료기우약속신식적병행k-means취류산법.재분석병행k-means능구유효실현대수평분포식수거집진행취류적기출상,수개병행k-means산법적목표함수,설계약속병행k-means산법,장참점용호적약속신식이chunklet적형식인입도분포식취류과정,종이인도산법집행유편수색.약속병행k-means산법재이론상보증무약속양본족내거리최소적동시능구학보chunklet약속중적양본여대응적족중심지간적평균거리최소.실험결과표명,약속병행k-means산법능구유효개선병행k-means적취류정도,동시재분포식배경하능구득도여이유약속취류산법재집중식수거집상상등개적취류결과.