计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2009年
14期
138-140
,共3页
集成学习%可扩展标记语言(xML)%文档聚类%Bagging算法
集成學習%可擴展標記語言(xML)%文檔聚類%Bagging算法
집성학습%가확전표기어언(xML)%문당취류%Bagging산법
将集成学习方法应用到XML文档聚类中来改进传统聚类算法的不足.提出一种标签与路径相结合的XML文档向量模型,基于这个模型,首先对原始文档集进行多次抽样,在新文档集上进行K均值聚类,然后对得到的聚类中心集合进行层次聚类.在人工数据集和真实数据集上的实验表明,该算法在召回率和精确率上优于K均值算法,并且增强了其鲁棒性.
將集成學習方法應用到XML文檔聚類中來改進傳統聚類算法的不足.提齣一種標籤與路徑相結閤的XML文檔嚮量模型,基于這箇模型,首先對原始文檔集進行多次抽樣,在新文檔集上進行K均值聚類,然後對得到的聚類中心集閤進行層次聚類.在人工數據集和真實數據集上的實驗錶明,該算法在召迴率和精確率上優于K均值算法,併且增彊瞭其魯棒性.
장집성학습방법응용도XML문당취류중래개진전통취류산법적불족.제출일충표첨여로경상결합적XML문당향량모형,기우저개모형,수선대원시문당집진행다차추양,재신문당집상진행K균치취류,연후대득도적취류중심집합진행층차취류.재인공수거집화진실수거집상적실험표명,해산법재소회솔화정학솔상우우K균치산법,병차증강료기로봉성.