现代电子技术
現代電子技術
현대전자기술
MODERN ELECTRONICS TECHNIQUE
2007年
24期
139-142
,共4页
王羽婷%徐维祥%张翼%李华华
王羽婷%徐維祥%張翼%李華華
왕우정%서유상%장익%리화화
相异度%凝聚聚类算法%自适应聚类算法%用户会话
相異度%凝聚聚類算法%自適應聚類算法%用戶會話
상이도%응취취류산법%자괄응취류산법%용호회화
传统的用于Web日志聚类的算法大都需要用户指定聚类个数.提出了一种新的自适应聚类算法并对Web日志用户会话进行聚类.该算法基于凝聚聚类思想和划分聚类思想,用初始数据集中每2个会话之间的相异度作为距离的度量,合并距离小于一定阈值的两个会话以产生初始聚类,再根据一定的规则动态地合并距离最小的会话类或会话,算法的结果是产生自然的聚类.最后,通过比较会话聚类的内部距离和类间距离来验证算法的有效性.这种聚类算法的最大优点在于,他能够产生自动的聚类,而不需要用户事先指定需要产生的聚类个数,并且能有效识别孤立点.实验表明,这种聚类能够产生较高质量的聚类效果.
傳統的用于Web日誌聚類的算法大都需要用戶指定聚類箇數.提齣瞭一種新的自適應聚類算法併對Web日誌用戶會話進行聚類.該算法基于凝聚聚類思想和劃分聚類思想,用初始數據集中每2箇會話之間的相異度作為距離的度量,閤併距離小于一定閾值的兩箇會話以產生初始聚類,再根據一定的規則動態地閤併距離最小的會話類或會話,算法的結果是產生自然的聚類.最後,通過比較會話聚類的內部距離和類間距離來驗證算法的有效性.這種聚類算法的最大優點在于,他能夠產生自動的聚類,而不需要用戶事先指定需要產生的聚類箇數,併且能有效識彆孤立點.實驗錶明,這種聚類能夠產生較高質量的聚類效果.
전통적용우Web일지취류적산법대도수요용호지정취류개수.제출료일충신적자괄응취류산법병대Web일지용호회화진행취류.해산법기우응취취류사상화화분취류사상,용초시수거집중매2개회화지간적상이도작위거리적도량,합병거리소우일정역치적량개회화이산생초시취류,재근거일정적규칙동태지합병거리최소적회화류혹회화,산법적결과시산생자연적취류.최후,통과비교회화취류적내부거리화류간거리래험증산법적유효성.저충취류산법적최대우점재우,타능구산생자동적취류,이불수요용호사선지정수요산생적취류개수,병차능유효식별고립점.실험표명,저충취류능구산생교고질량적취류효과.