计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2008年
23期
160-162
,共3页
Web日志%预处理%Web用户%概率潜在语义分析%聚类
Web日誌%預處理%Web用戶%概率潛在語義分析%聚類
Web일지%예처리%Web용호%개솔잠재어의분석%취류
Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助.通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概率转换为隐式变量Z对会话S的条件概率,然后在聚类分析中以此作为相似度计算依据.聚类算法采用了基于距离的k-medoids算法,以进一步改善聚类精度.实验结果验证了该算法的有效性和局限性.
Web用戶聚類知識可以為改進信息搜索效率和提供箇性化服務提供幫助.通過對海量日誌記錄分析,構建會話-頁麵矩陣;根據信息論理論,在會話-頁麵矩陣中權值計算中攷慮跼部和全跼權值貢獻;利用概率潛在語義分析將隱式變量Z對頁麵P的條件概率轉換為隱式變量Z對會話S的條件概率,然後在聚類分析中以此作為相似度計算依據.聚類算法採用瞭基于距離的k-medoids算法,以進一步改善聚類精度.實驗結果驗證瞭該算法的有效性和跼限性.
Web용호취류지식가이위개진신식수색효솔화제공개성화복무제공방조.통과대해량일지기록분석,구건회화-혈면구진;근거신식론이론,재회화-혈면구진중권치계산중고필국부화전국권치공헌;이용개솔잠재어의분석장은식변량Z대혈면P적조건개솔전환위은식변량Z대회화S적조건개솔,연후재취류분석중이차작위상사도계산의거.취류산법채용료기우거리적k-medoids산법,이진일보개선취류정도.실험결과험증료해산법적유효성화국한성.