燕山大学学报
燕山大學學報
연산대학학보
JOURNAL OF YANSHAN UNIVERSITY
2008年
1期
10-13
,共4页
Web日志挖掘%数据预处理%会话识别
Web日誌挖掘%數據預處理%會話識彆
Web일지알굴%수거예처리%회화식별
提出一种利用网页特征进行会话识别的方法.通过分析网页本身的特征,计算站点中所有网页的特征向量.根据这些特征向量,可以计算任意网页之间的相关程度.按照用户请求页面在日志中的时间顺序,可以得到日志中所有直接相邻的页面记录的关联程度曲线.通过设定一个阈值,在关联程度曲线中波动较大的位置形成会话边界.将关联程度大的页面分类到一个会话中,从而完成会话识别.
提齣一種利用網頁特徵進行會話識彆的方法.通過分析網頁本身的特徵,計算站點中所有網頁的特徵嚮量.根據這些特徵嚮量,可以計算任意網頁之間的相關程度.按照用戶請求頁麵在日誌中的時間順序,可以得到日誌中所有直接相鄰的頁麵記錄的關聯程度麯線.通過設定一箇閾值,在關聯程度麯線中波動較大的位置形成會話邊界.將關聯程度大的頁麵分類到一箇會話中,從而完成會話識彆.
제출일충이용망혈특정진행회화식별적방법.통과분석망혈본신적특정,계산참점중소유망혈적특정향량.근거저사특정향량,가이계산임의망혈지간적상관정도.안조용호청구혈면재일지중적시간순서,가이득도일지중소유직접상린적혈면기록적관련정도곡선.통과설정일개역치,재관련정도곡선중파동교대적위치형성회화변계.장관련정도대적혈면분류도일개회화중,종이완성회화식별.