微型机与应用
微型機與應用
미형궤여응용
MICROCOMPUTER & ITS APPLICATIONS
2012年
24期
67-69
,共3页
半监督聚类%成对约束%凝聚层次聚类
半鑑督聚類%成對約束%凝聚層次聚類
반감독취류%성대약속%응취층차취류
semi-supervised clustering%pairwise constraints%agglomerative hierarchical clustering
半监督聚类就是利用样本的监督信息来帮助提升无监督学习的性能。在半监督聚类中,成对约束(must—link约束和cannot—link约束)作为样本的先验知识被广泛地使用。凝聚层次聚类(AHC)也叫合成聚类,是层次聚类法的一种。提出了一种基于成对约束的半监督凝聚层次聚类算法(PS-AHC),该算法利用成对约束来改变聚类簇之间的距离,使聚类簇之间的距离更真实。在UCI数据集上的实验表明,PS—AHC能有效地提高聚类的准确率,是一种有前景的半监督聚类算法。
半鑑督聚類就是利用樣本的鑑督信息來幫助提升無鑑督學習的性能。在半鑑督聚類中,成對約束(must—link約束和cannot—link約束)作為樣本的先驗知識被廣汎地使用。凝聚層次聚類(AHC)也叫閤成聚類,是層次聚類法的一種。提齣瞭一種基于成對約束的半鑑督凝聚層次聚類算法(PS-AHC),該算法利用成對約束來改變聚類簇之間的距離,使聚類簇之間的距離更真實。在UCI數據集上的實驗錶明,PS—AHC能有效地提高聚類的準確率,是一種有前景的半鑑督聚類算法。
반감독취류취시이용양본적감독신식래방조제승무감독학습적성능。재반감독취류중,성대약속(must—link약속화cannot—link약속)작위양본적선험지식피엄범지사용。응취층차취류(AHC)야규합성취류,시층차취류법적일충。제출료일충기우성대약속적반감독응취층차취류산법(PS-AHC),해산법이용성대약속래개변취류족지간적거리,사취류족지간적거리경진실。재UCI수거집상적실험표명,PS—AHC능유효지제고취류적준학솔,시일충유전경적반감독취류산법。
Semi-supervised clustering uses the samples' supervised information to aid unsupervised learning. In the semi-su- pervised clustering, pairwise constraints information (must-link constraints and cannot-link constraints) are widely used as samples' prior knowledge. Agglomerative hierarchical clustering (AHC) is one kind of hierarchical clustering .This paper presents a semi-supervised agglomerative hierarchical clustering algorithm based on pairwise constraints (PS-AHC). The algorithm uses pairwise constraints to change distances of clusters. It makes distances of clusters closer to the truth. The results of experiments on the UCI data sets confirm that PS-AHC algorithm can improve the accuracy of clustering effectively and that it is a promising semi-supervised clustering algorithm.