网络安全技术与应用
網絡安全技術與應用
망락안전기술여응용
NETWORK SECURITY TECHNOLOGIES & APPLICATION
2012年
2期
45-50
,共6页
点击流(Click%Stream)%访问足迹图(Footstep%Graphs)%网站地图(Site%Map)%模式恢复算法(PRA)
點擊流(Click%Stream)%訪問足跡圖(Footstep%Graphs)%網站地圖(Site%Map)%模式恢複算法(PRA)
점격류(Click%Stream)%방문족적도(Footstep%Graphs)%망참지도(Site%Map)%모식회복산법(PRA)
Click Stream%Footstep Craphs%SiteMap%Pattem Restore Algorithm
点击流数据作为Web使用挖掘的一类最重要的数据来源,受到了许多Web使用挖掘算法的重视。而点击流数据的质量也往往在很大程度上影响Web使用挖掘算法的精确性。但是由于用户使用浏览器"后退"功能等多种因素的影响,服务器端记录的点击流数据往往会有大量的数据缺失或不一致。而这部分缺失的数据对于Web使用挖掘算法来说是非常关键的。本文首先分析了造成用户点击流数据缺失的各种原因。然后提出一种用于恢复缺失的用户点击流数据的算法—模式恢复算法(Pattern Restore Algorithm,PRA),并对这一算法的有效性和精确性进行评估。
點擊流數據作為Web使用挖掘的一類最重要的數據來源,受到瞭許多Web使用挖掘算法的重視。而點擊流數據的質量也往往在很大程度上影響Web使用挖掘算法的精確性。但是由于用戶使用瀏覽器"後退"功能等多種因素的影響,服務器耑記錄的點擊流數據往往會有大量的數據缺失或不一緻。而這部分缺失的數據對于Web使用挖掘算法來說是非常關鍵的。本文首先分析瞭造成用戶點擊流數據缺失的各種原因。然後提齣一種用于恢複缺失的用戶點擊流數據的算法—模式恢複算法(Pattern Restore Algorithm,PRA),併對這一算法的有效性和精確性進行評估。
점격류수거작위Web사용알굴적일류최중요적수거래원,수도료허다Web사용알굴산법적중시。이점격류수거적질량야왕왕재흔대정도상영향Web사용알굴산법적정학성。단시유우용호사용류람기"후퇴"공능등다충인소적영향,복무기단기록적점격류수거왕왕회유대량적수거결실혹불일치。이저부분결실적수거대우Web사용알굴산법래설시비상관건적。본문수선분석료조성용호점격류수거결실적각충원인。연후제출일충용우회복결실적용호점격류수거적산법—모식회복산법(Pattern Restore Algorithm,PRA),병대저일산법적유효성화정학성진행평고。
As the most important kind of data source,the Click Stream has drawn lots of Web Usage Mining algorithms’ attention.The quality of the Click Stream data has a profound effect to the accuracy of the mining result.But the Click Stream data may be inconsistent or lost due to the various factors such as the "back" function of a browser.And the lost data may be very important to the Web Usage Mining algorithms.In this paper,we first analysis the different reasons that may course the data lost,then we propose an algorithm called PRA(Pattern Restore Algorithm),to restore the lost Click Stream data,and finally evaluate the efficiency and accuracy of this algorithm.