计算机工程
計算機工程
계산궤공정
COMPUTER ENGINEERING
2009年
7期
49-51
,共3页
Web挖掘%数据预处理%阈值%Frame 页面%会话识别
Web挖掘%數據預處理%閾值%Frame 頁麵%會話識彆
Web알굴%수거예처리%역치%Frame 혈면%회화식별
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法.在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定.实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集.
針對Web日誌數據預處理中會話識彆這一重要環節,提齣一種優化的會話識彆算法.在用戶識彆後,通過過濾框架頁麵大幅度減少實驗產生的有效頁麵數,為每箇頁麵設置訪問時間閾值,併根據頁麵重要程度對該閾值進行調整,頁麵的重要性由頁麵內容及站點結構確定.實驗數據顯示,與對所有頁麵使用單一的先驗閾值進行會話識彆的方法相比較,該方法得到瞭真實性更彊的會話集.
침대Web일지수거예처리중회화식별저일중요배절,제출일충우화적회화식별산법.재용호식별후,통과과려광가혈면대폭도감소실험산생적유효혈면수,위매개혈면설치방문시간역치,병근거혈면중요정도대해역치진행조정,혈면적중요성유혈면내용급참점결구학정.실험수거현시,여대소유혈면사용단일적선험역치진행회화식별적방법상비교,해방법득도료진실성경강적회화집.