小型微型计算机系统
小型微型計算機繫統
소형미형계산궤계통
MINI-MICRO SYSTEMS
2013年
7期
1531-1533
,共3页
遗传算法%粒子群优化%混合优化%Web文档聚类
遺傳算法%粒子群優化%混閤優化%Web文檔聚類
유전산법%입자군우화%혼합우화%Web문당취류
GA (Genetic Algorithm)%PSO (Particle Swarm Optimization)%hybrid optimization%Web document clustering
Web文档聚类是web数据挖掘的重要任务之一,针对Web文档向量空间的高维性与数据聚类问题的最优化性质,采用LDA对文档向量空间进行降维,提出运用混合优化算法GA_PSO在此低维空间进行寻优,来发现Web文档集的最优簇结构.通过在真实数据集20Newsgroups的实验,结果表明我们的方法具有良好的聚类有效性,能较完全和准确地将主题相关的Web文档聚成一类.
Web文檔聚類是web數據挖掘的重要任務之一,針對Web文檔嚮量空間的高維性與數據聚類問題的最優化性質,採用LDA對文檔嚮量空間進行降維,提齣運用混閤優化算法GA_PSO在此低維空間進行尋優,來髮現Web文檔集的最優簇結構.通過在真實數據集20Newsgroups的實驗,結果錶明我們的方法具有良好的聚類有效性,能較完全和準確地將主題相關的Web文檔聚成一類.
Web문당취류시web수거알굴적중요임무지일,침대Web문당향량공간적고유성여수거취류문제적최우화성질,채용LDA대문당향량공간진행강유,제출운용혼합우화산법GA_PSO재차저유공간진행심우,래발현Web문당집적최우족결구.통과재진실수거집20Newsgroups적실험,결과표명아문적방법구유량호적취류유효성,능교완전화준학지장주제상관적Web문당취성일류.