计算机科学
計算機科學
계산궤과학
COMPUTER SCIENCE
2004年
4期
108-112
,共5页
Web日志挖掘%时间间隔%频度分布%随机向量%会话阈值
Web日誌挖掘%時間間隔%頻度分佈%隨機嚮量%會話閾值
Web일지알굴%시간간격%빈도분포%수궤향량%회화역치
本文针对Web日志中用户会话识别阈值问题,给出一种基于时间密度的频度分析方法.文中首先将基于时间间隔参数刻度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;然后建立频度与IP用户的相关矩阵,矩阵的列为访问频度,矩阵的行为用户IP,矩阵中的每一个位为某一时间间隔的访问频度.通过列向量的聚类分析,对不同类别用户的访问行为进行探讨.最后,对会话识别的阈值进行参数估计,并通过抽样对阈值进行检测和参数修正.
本文針對Web日誌中用戶會話識彆閾值問題,給齣一種基于時間密度的頻度分析方法.文中首先將基于時間間隔參數刻度的用戶訪問頻度定義為一箇隨機嚮量,給齣瞭隨機嚮量的切尾算法;然後建立頻度與IP用戶的相關矩陣,矩陣的列為訪問頻度,矩陣的行為用戶IP,矩陣中的每一箇位為某一時間間隔的訪問頻度.通過列嚮量的聚類分析,對不同類彆用戶的訪問行為進行探討.最後,對會話識彆的閾值進行參數估計,併通過抽樣對閾值進行檢測和參數脩正.
본문침대Web일지중용호회화식별역치문제,급출일충기우시간밀도적빈도분석방법.문중수선장기우시간간격삼수각도적용호방문빈도정의위일개수궤향량,급출료수궤향량적절미산법;연후건립빈도여IP용호적상관구진,구진적렬위방문빈도,구진적행위용호IP,구진중적매일개위위모일시간간격적방문빈도.통과렬향량적취류분석,대불동유별용호적방문행위진행탐토.최후,대회화식별적역치진행삼수고계,병통과추양대역치진행검측화삼수수정.