计算机应用与软件
計算機應用與軟件
계산궤응용여연건
COMPUTER APPLICATIONS AND SOFTWARE
2010年
2期
244-246
,共3页
Web 日志挖掘%数据预处理%会话识别
Web 日誌挖掘%數據預處理%會話識彆
Web 일지알굴%수거예처리%회화식별
会话识别是Web日志挖掘的关键步骤,会话识别的质量直接影响后续挖掘的准确性.在Timeout方法固定时间阈值的基础上,提出动态时间阈值,通过对样本日志的分析,得到不同时段的时间阈值.在处理日志文件时,根据当前会话开始记录的访问时间选择时间阈值.实验表明,该方法识别会话的质量比Timeout方法有了明显提高.
會話識彆是Web日誌挖掘的關鍵步驟,會話識彆的質量直接影響後續挖掘的準確性.在Timeout方法固定時間閾值的基礎上,提齣動態時間閾值,通過對樣本日誌的分析,得到不同時段的時間閾值.在處理日誌文件時,根據噹前會話開始記錄的訪問時間選擇時間閾值.實驗錶明,該方法識彆會話的質量比Timeout方法有瞭明顯提高.
회화식별시Web일지알굴적관건보취,회화식별적질량직접영향후속알굴적준학성.재Timeout방법고정시간역치적기출상,제출동태시간역치,통과대양본일지적분석,득도불동시단적시간역치.재처리일지문건시,근거당전회화개시기록적방문시간선택시간역치.실험표명,해방법식별회화적질량비Timeout방법유료명현제고.