软件产业与工程
軟件產業與工程
연건산업여공정
SOFTWARE INDUSTRY AND ENGINEERING
2013年
6期
53-56
,共4页
汤伟%黄培磊%陈璐艺%林祥
湯偉%黃培磊%陳璐藝%林祥
탕위%황배뢰%진로예%림상
行为分析%Web日志分析%用户识别
行為分析%Web日誌分析%用戶識彆
행위분석%Web일지분석%용호식별
文章提出了一种Web日志分析中数据预处理阶段用户识别的新算法.这种算法基于用户浏览行为的建模,能够很好地处理同一用户在不同地点上网情况下的用户识别问题.本算法通过归一化的支持度指标来选择最能代表用户浏览行为的行为模式,并用布尔编码的方式提取特征.用户间的相似度采用余弦相似方法计算,并利用KNN(K=1)的分类方法来识别用户.在特定构造的数据集上的实验表明文章提出的算法能够不依赖于IP信息识别用户并具有较好的识别率.
文章提齣瞭一種Web日誌分析中數據預處理階段用戶識彆的新算法.這種算法基于用戶瀏覽行為的建模,能夠很好地處理同一用戶在不同地點上網情況下的用戶識彆問題.本算法通過歸一化的支持度指標來選擇最能代錶用戶瀏覽行為的行為模式,併用佈爾編碼的方式提取特徵.用戶間的相似度採用餘絃相似方法計算,併利用KNN(K=1)的分類方法來識彆用戶.在特定構造的數據集上的實驗錶明文章提齣的算法能夠不依賴于IP信息識彆用戶併具有較好的識彆率.
문장제출료일충Web일지분석중수거예처리계단용호식별적신산법.저충산법기우용호류람행위적건모,능구흔호지처리동일용호재불동지점상망정황하적용호식별문제.본산법통과귀일화적지지도지표래선택최능대표용호류람행위적행위모식,병용포이편마적방식제취특정.용호간적상사도채용여현상사방법계산,병이용KNN(K=1)적분류방법래식별용호.재특정구조적수거집상적실험표명문장제출적산법능구불의뢰우IP신식식별용호병구유교호적식별솔.