辽宁工程技术大学学报(自然科学版)
遼寧工程技術大學學報(自然科學版)
료녕공정기술대학학보(자연과학판)
JOURNAL OF LIAONING TECHNICAL UNIVERSITY(NATURAL SCIENCE)
2006年
6期
890-892
,共3页
Web挖掘%层次聚类%Web搜索%后缀树
Web挖掘%層次聚類%Web搜索%後綴樹
Web알굴%층차취류%Web수색%후철수
为了便于用户浏览搜索引擎产生的搜索结果,结合STC算法和变色龙算法提出了一种中文网页的层次聚类方法-STCC算法.该方法采用雅可比系数修改了STC算法中基本类相似度的计算方法,然后根据基本类相似度矩阵,利用变色龙算法完成网页聚类.实验结果表明:STCC算法与STC算法相比,聚类精度提高将近10%,避免了单链接算法的链式效应,适用于大规模网页聚类.
為瞭便于用戶瀏覽搜索引擎產生的搜索結果,結閤STC算法和變色龍算法提齣瞭一種中文網頁的層次聚類方法-STCC算法.該方法採用雅可比繫數脩改瞭STC算法中基本類相似度的計算方法,然後根據基本類相似度矩陣,利用變色龍算法完成網頁聚類.實驗結果錶明:STCC算法與STC算法相比,聚類精度提高將近10%,避免瞭單鏈接算法的鏈式效應,適用于大規模網頁聚類.
위료편우용호류람수색인경산생적수색결과,결합STC산법화변색룡산법제출료일충중문망혈적층차취류방법-STCC산법.해방법채용아가비계수수개료STC산법중기본류상사도적계산방법,연후근거기본류상사도구진,이용변색룡산법완성망혈취류.실험결과표명:STCC산법여STC산법상비,취류정도제고장근10%,피면료단련접산법적련식효응,괄용우대규모망혈취류.