江苏科技大学学报(自然科学版)
江囌科技大學學報(自然科學版)
강소과기대학학보(자연과학판)
JOURNAL OF JIANGSU UNIVERSITY OF SCIENCE AND TECHNOLOGY(NATURAL SCIENCE EDITION)
2012年
1期
81-85
,共5页
Web挖掘%Web日志挖掘%数据预处理
Web挖掘%Web日誌挖掘%數據預處理
Web알굴%Web일지알굴%수거예처리
Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和路径完善中,在传统方法的基础上引入了启发性规则,通过实验数据验证了方法的有效性.
Web日誌挖掘中,數據源(日誌文件)的複雜性是挖掘所麵臨的主要問題之一.針對Web日誌挖掘的數據預處理問題,全麵梳理瞭數據預處理的全過程.針對日誌文件數據量巨大的難題,使用Python語言程序高效的實現瞭數據清理.在用戶識彆、會話識彆和路徑完善中,在傳統方法的基礎上引入瞭啟髮性規則,通過實驗數據驗證瞭方法的有效性.
Web일지알굴중,수거원(일지문건)적복잡성시알굴소면림적주요문제지일.침대Web일지알굴적수거예처리문제,전면소리료수거예처리적전과정.침대일지문건수거량거대적난제,사용Python어언정서고효적실현료수거청리.재용호식별、회화식별화로경완선중,재전통방법적기출상인입료계발성규칙,통과실험수거험증료방법적유효성.