计算机应用
計算機應用
계산궤응용
COMPUTER APPLICATION
2013年
7期
1969-1972
,共4页
王丽娟%郝志峰%蔡瑞初%温雯
王麗娟%郝誌峰%蔡瑞初%溫雯
왕려연%학지봉%채서초%온문
聚类融合%选择性聚类融合%随机取样%聚类决策评价%K-means
聚類融閤%選擇性聚類融閤%隨機取樣%聚類決策評價%K-means
취류융합%선택성취류융합%수궤취양%취류결책평개%K-means
clustering ensemble%selective clustering ensemble%random sampling%evaluation index of clustering%K-means
由于缺少数据分布、参数和数据类别标记的先验信息,部分基聚类的正确性无法保证,进而影响聚类融合的性能;而且不同基聚类决策对于聚类融合的贡献程度不同,同等对待基聚类决策,将影响聚类融合结果的提升.为解决此问题,提出了基于随机取样的选择性K-means聚类融合算法(RS-KMCE).该算法中的随机取样策略可以避免基聚类决策选取陷入局部极小,而且依据多样性和正确性定义的综合评价值,有利于算法快速收敛到较优的基聚类子集,提升融合性能.通过2个仿真数据库和4个UCI数据库的实验结果显示:RS-KMCE的聚类性能优于K-means 算法、K-means融合算法(KMCE)以及基于Bagging的选择性K-means聚类融合(BA-KMCE).
由于缺少數據分佈、參數和數據類彆標記的先驗信息,部分基聚類的正確性無法保證,進而影響聚類融閤的性能;而且不同基聚類決策對于聚類融閤的貢獻程度不同,同等對待基聚類決策,將影響聚類融閤結果的提升.為解決此問題,提齣瞭基于隨機取樣的選擇性K-means聚類融閤算法(RS-KMCE).該算法中的隨機取樣策略可以避免基聚類決策選取陷入跼部極小,而且依據多樣性和正確性定義的綜閤評價值,有利于算法快速收斂到較優的基聚類子集,提升融閤性能.通過2箇倣真數據庫和4箇UCI數據庫的實驗結果顯示:RS-KMCE的聚類性能優于K-means 算法、K-means融閤算法(KMCE)以及基于Bagging的選擇性K-means聚類融閤(BA-KMCE).
유우결소수거분포、삼수화수거유별표기적선험신식,부분기취류적정학성무법보증,진이영향취류융합적성능;이차불동기취류결책대우취류융합적공헌정도불동,동등대대기취류결책,장영향취류융합결과적제승.위해결차문제,제출료기우수궤취양적선택성K-means취류융합산법(RS-KMCE).해산법중적수궤취양책략가이피면기취류결책선취함입국부겁소,이차의거다양성화정학성정의적종합평개치,유리우산법쾌속수렴도교우적기취류자집,제승융합성능.통과2개방진수거고화4개UCI수거고적실험결과현시:RS-KMCE적취류성능우우K-means 산법、K-means융합산법(KMCE)이급기우Bagging적선택성K-means취류융합(BA-KMCE).