福建电脑
福建電腦
복건전뇌
FUJIAN COMPUTER
2013年
1期
1-3,6
,共4页
Web日志%用户聚类%访问路径树
Web日誌%用戶聚類%訪問路徑樹
Web일지%용호취류%방문로경수
研究了海量Web日志用户聚类的时间效率和准确性问题,采用构建访问路径树的方法删除重复路径,大大减少数据空间,然后根据访问时间定义相似性,提出改进的?截聚类算法,能够保证同类用户两两相似,类间用户互不相似,实验表明这种算法提高了聚类的准确性.
研究瞭海量Web日誌用戶聚類的時間效率和準確性問題,採用構建訪問路徑樹的方法刪除重複路徑,大大減少數據空間,然後根據訪問時間定義相似性,提齣改進的?截聚類算法,能夠保證同類用戶兩兩相似,類間用戶互不相似,實驗錶明這種算法提高瞭聚類的準確性.
연구료해량Web일지용호취류적시간효솔화준학성문제,채용구건방문로경수적방법산제중복로경,대대감소수거공간,연후근거방문시간정의상사성,제출개진적?절취류산법,능구보증동류용호량량상사,류간용호호불상사,실험표명저충산법제고료취류적준학성.