软件学报
軟件學報
연건학보
JOURNAL OF SOFTWARE
2010年
11期
2814-2825
,共12页
王红军%李志蜀%戚建淮%成镲%周鹏%周维
王紅軍%李誌蜀%慼建淮%成镲%週鵬%週維
왕홍군%리지촉%척건회%성찰%주붕%주유
半监督聚类集成%变分推理%必连%不连
半鑑督聚類集成%變分推理%必連%不連
반감독취류집성%변분추리%필련%불련
已有的聚类集算法基本上都是非监督聚类集成算法,这样不能利用已知信息,使得聚类集成的准确性、鲁棒性和稳定性降低.把半监督学习和聚类集成结合起来,设计半监督聚类集成模型来克服这些缺点.主要工作包括:第一,设计了基于贝叶斯网络的半监督聚类集成(semi-supervised cluster ensemble,简称SCE)模型,并对模型用变分法进行了推理求解;第二,在此基础上,给出了EM(expectation maximization)框架下的具体算法;第三,从UCI(University of California, Irvine)机器学习库中选取部分数据来做实验.实验结果表明,SCE模型本身及其变分推理后所设计的EM算法都能进行半监督聚类集成,总的来说,效果比NMFS(algorithm of nonnegative-matrix-factorization based semi-supervised)、半监督SVM(support vector machine)、LVCE(latent variable model for cluster ensemble)等算法要好.该半监督聚类集成模型聚集了半监督学习和聚类集成两者的优点,最后的聚类结果比单纯的半监督聚类或聚类集成的效果都要好.
已有的聚類集算法基本上都是非鑑督聚類集成算法,這樣不能利用已知信息,使得聚類集成的準確性、魯棒性和穩定性降低.把半鑑督學習和聚類集成結閤起來,設計半鑑督聚類集成模型來剋服這些缺點.主要工作包括:第一,設計瞭基于貝葉斯網絡的半鑑督聚類集成(semi-supervised cluster ensemble,簡稱SCE)模型,併對模型用變分法進行瞭推理求解;第二,在此基礎上,給齣瞭EM(expectation maximization)框架下的具體算法;第三,從UCI(University of California, Irvine)機器學習庫中選取部分數據來做實驗.實驗結果錶明,SCE模型本身及其變分推理後所設計的EM算法都能進行半鑑督聚類集成,總的來說,效果比NMFS(algorithm of nonnegative-matrix-factorization based semi-supervised)、半鑑督SVM(support vector machine)、LVCE(latent variable model for cluster ensemble)等算法要好.該半鑑督聚類集成模型聚集瞭半鑑督學習和聚類集成兩者的優點,最後的聚類結果比單純的半鑑督聚類或聚類集成的效果都要好.
이유적취류집산법기본상도시비감독취류집성산법,저양불능이용이지신식,사득취류집성적준학성、로봉성화은정성강저.파반감독학습화취류집성결합기래,설계반감독취류집성모형래극복저사결점.주요공작포괄:제일,설계료기우패협사망락적반감독취류집성(semi-supervised cluster ensemble,간칭SCE)모형,병대모형용변분법진행료추리구해;제이,재차기출상,급출료EM(expectation maximization)광가하적구체산법;제삼,종UCI(University of California, Irvine)궤기학습고중선취부분수거래주실험.실험결과표명,SCE모형본신급기변분추리후소설계적EM산법도능진행반감독취류집성,총적래설,효과비NMFS(algorithm of nonnegative-matrix-factorization based semi-supervised)、반감독SVM(support vector machine)、LVCE(latent variable model for cluster ensemble)등산법요호.해반감독취류집성모형취집료반감독학습화취류집성량자적우점,최후적취류결과비단순적반감독취류혹취류집성적효과도요호.