计算机系统应用
計算機繫統應用
계산궤계통응용
APPLICATIONS OF THE COMPUTER SYSTEMS
2014年
12期
191-196
,共6页
数据预处理%用户识别%会话识别%编辑距离%最长公共子序列
數據預處理%用戶識彆%會話識彆%編輯距離%最長公共子序列
수거예처리%용호식별%회화식별%편집거리%최장공공자서렬
data preprocessing%user identification%session identification%levenshtein distance%longest common subsequence
随着互联网的快速发展, Web日志的用户行为分析已经成为互联网技术领域的研究热点之一。会话识别是Web日志用户行为分析的关键步骤,精准的会话识别是有效进行用户行为分析的基础。本文在IIS Web日志分析的基础上,提出了一种基于 URL 相似度的会话识别方法。实验结果表明,此方法可以有效的识别出用户的真实会话。
隨著互聯網的快速髮展, Web日誌的用戶行為分析已經成為互聯網技術領域的研究熱點之一。會話識彆是Web日誌用戶行為分析的關鍵步驟,精準的會話識彆是有效進行用戶行為分析的基礎。本文在IIS Web日誌分析的基礎上,提齣瞭一種基于 URL 相似度的會話識彆方法。實驗結果錶明,此方法可以有效的識彆齣用戶的真實會話。
수착호련망적쾌속발전, Web일지적용호행위분석이경성위호련망기술영역적연구열점지일。회화식별시Web일지용호행위분석적관건보취,정준적회화식별시유효진행용호행위분석적기출。본문재IIS Web일지분석적기출상,제출료일충기우 URL 상사도적회화식별방법。실험결과표명,차방법가이유효적식별출용호적진실회화。
With the rapid development of Internet, Web log user behavior analysis has become one of research hotspots in the field of Internet technology. Session identification is the key step in the Web log user behavior analysis. Accurate session identification is the foundation of effective user behavior analysis. IIS Web log analysis is presented in this paper on the basis of a session identification method based on known URL. The experimental results show that this method can effectively identify the user’s real conversation.