系统工程与电子技术
繫統工程與電子技術
계통공정여전자기술
SYSTEMS ENGINEERING AND ELECTRONICS
2009年
12期
2994-2997
,共4页
网络日志%数据挖掘%预处理%会话识别
網絡日誌%數據挖掘%預處理%會話識彆
망락일지%수거알굴%예처리%회화식별
Web log%data mining%preprocessings transaction session identification
对网络日志数据挖掘预处理技术进行研究,针对Frame页面过滤方法与超时阈值设定进行分析,提出了应用ID3算法改进Frame页面过滤过程中丢失SubFrame页面信息且需要进行站点提升步骤.在超时阈值的设定方面采用动态修正方法,提高预处理技术对长时间会话的识别能力的改进方法.通过实验验证,该方法有效地减少了预处理过程中的信息丢失,同时提高了挖掘结果的精度.
對網絡日誌數據挖掘預處理技術進行研究,針對Frame頁麵過濾方法與超時閾值設定進行分析,提齣瞭應用ID3算法改進Frame頁麵過濾過程中丟失SubFrame頁麵信息且需要進行站點提升步驟.在超時閾值的設定方麵採用動態脩正方法,提高預處理技術對長時間會話的識彆能力的改進方法.通過實驗驗證,該方法有效地減少瞭預處理過程中的信息丟失,同時提高瞭挖掘結果的精度.
대망락일지수거알굴예처리기술진행연구,침대Frame혈면과려방법여초시역치설정진행분석,제출료응용ID3산법개진Frame혈면과려과정중주실SubFrame혈면신식차수요진행참점제승보취.재초시역치적설정방면채용동태수정방법,제고예처리기술대장시간회화적식별능력적개진방법.통과실험험증,해방법유효지감소료예처리과정중적신식주실,동시제고료알굴결과적정도.
Data preprocessing method of Web log mining is studied.Frame pages filtering and overtime threshold value seting are analyzed.The improved method based on induction of decision tree(ID3) algorithm and threshold value dynamic amendment algorithm is proposed.This method deals with information loss by Frame pages filtering and threshold value fixing.Transaction session identification ability is also enchanced.The experiment about this method shows that this method is efficient in improving accuracy of mining result.