计算机技术与发展
計算機技術與髮展
계산궤기술여발전
COMPUTER TECHNOLOGY AND DEVELOPMENT
2010年
5期
47-50
,共4页
Web日志挖掘%数据预处理%会话识别%数据清洗
Web日誌挖掘%數據預處理%會話識彆%數據清洗
Web일지알굴%수거예처리%회화식별%수거청세
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果.详细分析了数据预处理的过程,提出一种改进的数据清洗方法,以提高日志挖掘中数据预处理的效率,并针对Web日志数据预处理中会话识别这一重要环节,提出一种改进的会话识别方法.在用户识别后,根据页面内容、站点结构确定页面重要程度,对阈值进行调整.然后,根据用户对页面内容的兴趣度来删除会话中的链接页面和不感兴趣的页面.实验结果表明,提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合.
數據預處理在Web日誌挖掘過程中起著至關重要的作用,直接影響日誌挖掘的質量和結果.詳細分析瞭數據預處理的過程,提齣一種改進的數據清洗方法,以提高日誌挖掘中數據預處理的效率,併針對Web日誌數據預處理中會話識彆這一重要環節,提齣一種改進的會話識彆方法.在用戶識彆後,根據頁麵內容、站點結構確定頁麵重要程度,對閾值進行調整.然後,根據用戶對頁麵內容的興趣度來刪除會話中的鏈接頁麵和不感興趣的頁麵.實驗結果錶明,提齣的方法能更準確地確定頁麵訪問時間閾值,得到更為閤理有效的會話集閤.
수거예처리재Web일지알굴과정중기착지관중요적작용,직접영향일지알굴적질량화결과.상세분석료수거예처리적과정,제출일충개진적수거청세방법,이제고일지알굴중수거예처리적효솔,병침대Web일지수거예처리중회화식별저일중요배절,제출일충개진적회화식별방법.재용호식별후,근거혈면내용、참점결구학정혈면중요정도,대역치진행조정.연후,근거용호대혈면내용적흥취도래산제회화중적련접혈면화불감흥취적혈면.실험결과표명,제출적방법능경준학지학정혈면방문시간역치,득도경위합리유효적회화집합.