计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2010年
11期
217-222
,共6页
雷小锋%何涛%李奎儒%谢昆青%丁世飞
雷小鋒%何濤%李奎儒%謝昆青%丁世飛
뢰소봉%하도%리규유%사곤청%정세비
聚类算法%变体混合模型%结构稳定性%分裂-合并
聚類算法%變體混閤模型%結構穩定性%分裂-閤併
취류산법%변체혼합모형%결구은정성%분렬-합병
聚类是在假设数据具有某种群聚结构的前提下根据观察到的无标记样本发现数据的最优划分.现有的聚类算法通常简单地导出假设结构和给定先验下最优或较优的聚类结果,体现为算法对样本分布拟合度的迭代最优化,即算法有效性.实际上,聚类的有效性取决于结构有效性、算法有效性和先验有效性3个方面的因素.基于这种考虑,提出了一种变体混合模型的聚类结构假设,以及判定聚类结构的稳定性的度量和方法,在算法有效的前提下通过单簇的分裂与合并来改进聚类结构的稳定性,并得到最终聚类结果,设计并实现了SMClus聚类算法,通过对模拟数据和真实数据的聚类实验,例证了方法的有效性.
聚類是在假設數據具有某種群聚結構的前提下根據觀察到的無標記樣本髮現數據的最優劃分.現有的聚類算法通常簡單地導齣假設結構和給定先驗下最優或較優的聚類結果,體現為算法對樣本分佈擬閤度的迭代最優化,即算法有效性.實際上,聚類的有效性取決于結構有效性、算法有效性和先驗有效性3箇方麵的因素.基于這種攷慮,提齣瞭一種變體混閤模型的聚類結構假設,以及判定聚類結構的穩定性的度量和方法,在算法有效的前提下通過單簇的分裂與閤併來改進聚類結構的穩定性,併得到最終聚類結果,設計併實現瞭SMClus聚類算法,通過對模擬數據和真實數據的聚類實驗,例證瞭方法的有效性.
취류시재가설수거구유모충군취결구적전제하근거관찰도적무표기양본발현수거적최우화분.현유적취류산법통상간단지도출가설결구화급정선험하최우혹교우적취류결과,체현위산법대양본분포의합도적질대최우화,즉산법유효성.실제상,취류적유효성취결우결구유효성、산법유효성화선험유효성3개방면적인소.기우저충고필,제출료일충변체혼합모형적취류결구가설,이급판정취류결구적은정성적도량화방법,재산법유효적전제하통과단족적분렬여합병래개진취류결구적은정성,병득도최종취류결과,설계병실현료SMClus취류산법,통과대모의수거화진실수거적취류실험,예증료방법적유효성.