科技信息
科技信息
과기신식
SCIENTIFIC & TECHNICAL INFORMATION
2011年
15期
104-105,119
,共3页
编辑距离%聚类%浏览序列
編輯距離%聚類%瀏覽序列
편집거리%취류%류람서렬
针对来自不同用户的Web浏览序列往往长短不一的问题,引入编辑距离用于计算浏览序列之间的不相似性.运用含两个阈值的顺序聚类算法对Web浏览模式进行分析,无需事先指定聚类的数量,降低了对测览序列参与聚类的顺序的依赖性.数据来源于真实数据的仿真实验证明了方法的有效性和灵活性.
針對來自不同用戶的Web瀏覽序列往往長短不一的問題,引入編輯距離用于計算瀏覽序列之間的不相似性.運用含兩箇閾值的順序聚類算法對Web瀏覽模式進行分析,無需事先指定聚類的數量,降低瞭對測覽序列參與聚類的順序的依賴性.數據來源于真實數據的倣真實驗證明瞭方法的有效性和靈活性.
침대래자불동용호적Web류람서렬왕왕장단불일적문제,인입편집거리용우계산류람서렬지간적불상사성.운용함량개역치적순서취류산법대Web류람모식진행분석,무수사선지정취류적수량,강저료대측람서렬삼여취류적순서적의뢰성.수거래원우진실수거적방진실험증명료방법적유효성화령활성.