计算机学报
計算機學報
계산궤학보
CHINESE JOURNAL OF COMPUTERS
2012年
11期
2337-2347
,共11页
韩忠明%陈妮%乐嘉锦%段大高%孙践知
韓忠明%陳妮%樂嘉錦%段大高%孫踐知
한충명%진니%악가금%단대고%손천지
聚类%时间序列%热点话题%小波
聚類%時間序列%熱點話題%小波
취류%시간서렬%열점화제%소파
聚类热度时间序列是揭示和建模网络热点话题形成与发展的重要过程.Leskovec等人在2010年提出面向话题时间序列的K_SC聚类算法,其精确度较高且能较好地刻画话题内在发展趋势特征.但K_SC算法具有对初始类矩阵中心高度敏感、高时间复杂度等特性,使其难以在实际高维大数据集上应用.文中结合小波变换技术,提出一个新的迭代式聚类算法WKSC,主要提出两个创新:(1)用Haar小波变换将原始时间序列进行压缩,降低原始时间序列的维度,从而降低了算法的时间复杂度;(2)在Haar反小波变换中,将低维聚类返回得到的矩阵中心作为高维聚类的初始矩阵中心,在迭代聚类过程中优化了对初始矩阵中心高敏感性的问题,提高了聚类的效果.文中分别采用国内外3个数据集作为测试样本,进行了大量的实验.实验结果表明WKSC算法能显著降低聚类的时间复杂度,同时改进聚类效果.WKSC算法可很好的应用于大量高维热点话题的模式分析.
聚類熱度時間序列是揭示和建模網絡熱點話題形成與髮展的重要過程.Leskovec等人在2010年提齣麵嚮話題時間序列的K_SC聚類算法,其精確度較高且能較好地刻畫話題內在髮展趨勢特徵.但K_SC算法具有對初始類矩陣中心高度敏感、高時間複雜度等特性,使其難以在實際高維大數據集上應用.文中結閤小波變換技術,提齣一箇新的迭代式聚類算法WKSC,主要提齣兩箇創新:(1)用Haar小波變換將原始時間序列進行壓縮,降低原始時間序列的維度,從而降低瞭算法的時間複雜度;(2)在Haar反小波變換中,將低維聚類返迴得到的矩陣中心作為高維聚類的初始矩陣中心,在迭代聚類過程中優化瞭對初始矩陣中心高敏感性的問題,提高瞭聚類的效果.文中分彆採用國內外3箇數據集作為測試樣本,進行瞭大量的實驗.實驗結果錶明WKSC算法能顯著降低聚類的時間複雜度,同時改進聚類效果.WKSC算法可很好的應用于大量高維熱點話題的模式分析.
취류열도시간서렬시게시화건모망락열점화제형성여발전적중요과정.Leskovec등인재2010년제출면향화제시간서렬적K_SC취류산법,기정학도교고차능교호지각화화제내재발전추세특정.단K_SC산법구유대초시류구진중심고도민감、고시간복잡도등특성,사기난이재실제고유대수거집상응용.문중결합소파변환기술,제출일개신적질대식취류산법WKSC,주요제출량개창신:(1)용Haar소파변환장원시시간서렬진행압축,강저원시시간서렬적유도,종이강저료산법적시간복잡도;(2)재Haar반소파변환중,장저유취류반회득도적구진중심작위고유취류적초시구진중심,재질대취류과정중우화료대초시구진중심고민감성적문제,제고료취류적효과.문중분별채용국내외3개수거집작위측시양본,진행료대량적실험.실험결과표명WKSC산법능현저강저취류적시간복잡도,동시개진취류효과.WKSC산법가흔호적응용우대량고유열점화제적모식분석.