计算机工程与应用
計算機工程與應用
계산궤공정여응용
COMPUTER ENGINEERING AND APPLICATIONS
2011年
12期
110-112,121
,共4页
网页检索结果聚类%层次聚类%两阶段聚类
網頁檢索結果聚類%層次聚類%兩階段聚類
망혈검색결과취류%층차취류%량계단취류
在网页聚类中,HAC(Hierarchical Agglomerative Clustering)算法和 K-means 算法都是经常用到的.但它们都有各自的不足.提出一种两阶段聚类方法.第一阶段利用 HAC 聚类算法对网络检索结果的标题进行聚类,第二阶段以第一阶段结果作为初始中心用 K-means 算法聚类标题和摘要取得比较合理的聚类结果.由于标题一般都比较短,可以大大减少 HAC 算法的运行时间.这样既满足网络检索对时间的要求又可以得到较好的聚类结果.
在網頁聚類中,HAC(Hierarchical Agglomerative Clustering)算法和 K-means 算法都是經常用到的.但它們都有各自的不足.提齣一種兩階段聚類方法.第一階段利用 HAC 聚類算法對網絡檢索結果的標題進行聚類,第二階段以第一階段結果作為初始中心用 K-means 算法聚類標題和摘要取得比較閤理的聚類結果.由于標題一般都比較短,可以大大減少 HAC 算法的運行時間.這樣既滿足網絡檢索對時間的要求又可以得到較好的聚類結果.
재망혈취류중,HAC(Hierarchical Agglomerative Clustering)산법화 K-means 산법도시경상용도적.단타문도유각자적불족.제출일충량계단취류방법.제일계단이용 HAC 취류산법대망락검색결과적표제진행취류,제이계단이제일계단결과작위초시중심용 K-means 산법취류표제화적요취득비교합리적취류결과.유우표제일반도비교단,가이대대감소 HAC 산법적운행시간.저양기만족망락검색대시간적요구우가이득도교호적취류결과.